小暑。温风至,蟋蟀居宇,鹰始鸷。长安街上的梧桐叶在上午十点之后就开始卷边了——不是芒种那种午后才会出现的微卷,是小暑上午的阳光就已经足够烫到让叶片边缘的水分蒸散快过根系输送的速度。银杏的蜡质层还在撑着——但蜡质层表面已经浮现出一层极薄的、肉眼几乎看不见的白膜,是蜡质在连续高温下氧化后失去光泽的结果。树洞里的小风在芒种被银杏中层叶片挡住全部直射光之后,只靠漫反射的散射光进行光合作用——叶片比银杏叶小,叶绿体密度比春天时高了大约三分之一。它没有在争光——它在等待银杏叶片之间的距离在秋季被叶柄离层拉开。一个不争光的物种,靠调整自身的叶绿体密度来适应低光——不争,但要活。
小暑前三天,秦铭主持了公约第二十一条国内法兼容性审查的第一次联席会议。
会议室在法工委东侧那栋灰砖老楼的三层。楼不高,窗外正对着的银杏树已经在这个季节把全部叶片展开到了最大面积——树冠的密度把正午直射的阳光拦下了至少一半。剩下一半透过叶片间隙散成无数小块光斑落在会议桌的浅黄色木皮上。光斑的形状全是银杏叶之间的空隙——每一块光斑都是叶片之间而非叶片之上。秦铭在走进会议室时注意到了这一点,他想起了赵豫章在夏至最后一张便签上写的那句话——“两侧各有一条缝“——现在这条缝被银杏叶在正午的太阳下放大成了满桌光斑。不是一扇门——是许多扇小门。每扇小门只能照到会议桌的一个位置。
参会方有外交部国际组织司、工信部技术标准司、教育部政策法规司、卫健委医疗技术评估中心、以及法工委内部的法律兼容性评估组。方涵坐在教育部的名牌之后,孟正则坐在工信部的名牌之后,秦铭坐在主持人位置。外交部派了国际组织司的副司长——一个在联合国公约体系下工作了十几年的中年女外交官;她的名牌上只有一个姓——向。
秦铭在会议开头没有做常规的议程介绍。他把赵豫章在照会分析报告封面批的那行字投影到屏幕上:“不审查公约是否符合国内法——审查国内法在公约生效后需要被调整的范围。该调整的不拖延,该保留的公开说明理由。“
“议长在写这段批语时把顺序做了调整。正常的兼容性审查是拿国内法当尺子去量公约——议长把尺子和被量的对象调换了。他不是在要求国内法向公约屈服——他是在帮我们避免一个正式的外交法理困境:如果国内法在公约签署前没有进行主动校准,签署后每条与公约存在结构性位面差异的国内法规都将面临被缔约国评议会议逐个质询的程序——那比主动校准消耗更多的政治信用。“
向副司长微微点了下头。她面前的文件夹里有一份她昨晚逐字读过的巴黎公约修订稿对照版,关键段落的旁边用铅笔注了相应的国内法规索引号。她没有打开那份文件夹。
“我可以为各位提供两个技术背景。“她的声音平稳而克制。“第一,公约第二十一条补充条款在法理上的刚性程度超出了我们外交部的早期预期。早期判断——在玛丽亚·冯教授最初草拟的版本中——第二十一条被定位为''建议性条款'',缔约国可以选择国内立法转化的范围和速度。但经过布鲁塞尔法律语言专家的几轮打磨后——特别是在孟女士的论文被正式引为证据之后——这一条款被升级为''带核查机制的刚性条款''。这意味着——缔约国不是可以选做,是必须做。第二——“
她打开文件夹,但没有翻页。她已经记住了她要说的内容。
“第二,公约的核查机制给了缔约国一个在我们的法律传统中几乎不常见到的制度性出口——''周期性再校准''。公约不要求缔约国的国内法在签署那一刻就完全符合每一条款——但它要求缔约国在每次公约审议周期中提交关于国内法已校准范围和待校准范围的公开报告。这个制度设计和议长那扇''反复校准的门''是同一个逻辑。门框是公约——但门的开合角度是各国自己调整的。“
孟正则听到“周期性再校准“时在笔记本上记了短促的几个字。方涵注意到了他记字的动作——他在每次听到一个新概念时都会先记,然后在不被注意的情况下用铅笔在自己记的字上反复修改措辞。这次他没有修改——他只写了“再校准——门的角度“。
秦铭把投影切换到方涵在夏至后整理的护栏第三批评估数据摘要。屏幕上的数据表的格式和平时完全不同——方涵花了整个周末把评估报告从教育部内部的行政数据分析语言翻译成了可以被外交部和卫健委同时理解的交叉学科语言。她把“相关性“换成“趋势方向“,把“统计显著性“换成“信号强度评级“,把“因果推断不可分离“换成“机制假说待验证“。翻译之后的表失去了分析精度,但获得了可读性。
“在夏至后第三批护栏跟踪数据中,我们观察到一个在统计显著性和因果推断上尚未可分离但方向高度一致的信号——退出飞升积分试点的人员中,被系统标注为''信息不完整''的个体,与在退出后一段时间内其信用评级被银行系统自动下调之间存在低度但持续的相关性。我在此次会议中不使用''因果''一词——我只用''关联方向''。关联方向是单向的——所有可观测个案中,评级下调出现在''信息不完整''标注之后——无一例反向。“
卫健委的代表——一个四十多岁的公共卫生政策专家——从笔记本上抬头。他问了一个方涵意料之中的问题——“你说的''信息不完整''标注——是不是飞升积分制自己生成的。如果是它自己生成又自己用来触发下游金融系统的自动决策——这种反馈回路在公共卫生领域被称为自验预言。“
方涵沉默了片刻。然后回答。
“你问到了护栏在技术上最脆弱的位置。''信息不完整''的判定来源是飞升积分系统的数据完整性检查模块——这个模块的设计初衷是防止用户通过不填报某些维度来人为拉低或拉高自己的效能总分。在模块的原始设计文档里,它被描述为一项''质量控制机制''——不是惩罚。但当这个标签被下游金融机构通过数据接口自动读取并加权进信用评估模型后——它不再是质量控制。它是自动惩罚——惩罚理由和惩罚执行之间没有任何一个人做决定。“
孟正则把铅笔放在桌上——啪的一小声木笔杆落在木桌面上。
“''质量控制''在技术文档中是中性词——在飞升积分嵌入金融准入之后是淘汰标签。这是护栏''不交叉''原则正在面对的现实中第一个可被量化的风险——风险不是飞升积分系统自己造成的——是下游机构被系统对接之后在无人授权的情况下自动跑出来的。方涵——你刚才说的''信号强度评级''把它定在什么等级。“
“橙色预警——不要求行政紧急介入——但要求在观察期内暂停效能积分在金融准入领域的任何授权范围扩展。“
孟正则点了点头,把这个评级连同方涵刚才的原话一起记在笔记本上。他写的字仍然带一点上翘的笔锋——和他父亲写家信时的收笔习惯一模一样。
联席会议结束后的傍晚,方涵回到了教育部的办公室。窗外小暑前的高温已经让楼下的灌木和草坪被浇灌喷头洒过一轮水——水滴在叶片上迅速蒸散成看不见的水汽。她把会议记录整理成两份——一份是正式的会议纪要,送给秦铭归档;另一份是她自己留的“翻译草稿“——里面把向副司长的外交法理语言重新翻译成了护栏术语。
“公约第二十一条不是护栏的上位法——是护栏拥有了一个被国际社会广泛承认的法理坐标系。在这个坐标系里,护栏的三条基本原则——不交叉、不可逆、可撤回——对应的不是公约的字面措辞,是公约禁止''以非中立性标准作为唯一依据''这一条背后的底层逻辑——''唯一''就是对排斥性后果的禁令。如果公约禁止''唯一'',那么护栏在宪法结构中的法理基础可以表述为——护栏是禁止''唯一''原则在国内行政惯例层面的具体化。“
她在这段话下面用铅笔补充了一句——“我用了三年多时间来理解''护栏''这个词——从韩世清在本子上画出第一个框框开始。直到今天,我才在一份国际公约里找到了它的外面法理父文。护栏有了父文——但父文使用了完全不同的语言系统。翻译始终是我们的事。“
她把文件夹放进抽屉——和她的护栏跟踪评估表放在一起。跟踪表现在已经填到了第四批——每一列的“合规率“从一个简单的百分数变成了一句话的定性描述。“不交叉合规率:在可观测范围内——已拦截全部已识别的跨系统调用——但''已识别''的边界随系统版本更新而动态变化。“方涵每次更新这个字段都要重新审视自己在芒种时写下的那句观察——“护栏不是在建的时候长到位的——是每推一个版本就要重新砌一次。“好的观察不需要修改——它只是被时间反复证实。
小暑前一天,孟正则收到了工信部技术标准司关于“效能评估量表默认校准数据集中性别偏误“的独立核查初步报告。
报告的封面被技术标准司的一位高级统计师用黑色中性笔写了一行备注——“本报告为独立核查第一阶段统计数据,仅包含已备案飞升积分试点评估框架中由第三方数据审计公司核验过的数据子集。因原始数据集的性别编码方式和不同企业对''性别''字段的收集标准不统一,核验范围已被限缩至能够可靠识别性别归属的样本——不代表总样本性别分布。“
这份谨慎的备注已经是预警。孟正则把统计师的手写备注逐字读完后翻开了报告正页。
核查共覆盖了飞升积分制已备案的评估框架中七个主要效能维度的原始校准数据集——反应速度、决策精度、工作记忆广幅、模式识别、并行任务处理、错误恢复、适应性学习速率。七个维度中有四个在校准数据集中呈现出了在统计意义上的性别差异——不是个别企业的数据——是同一维度在不同企业数据中的差异方向一致。
反应速度维度的平均基准值——以男性样本建立。决策精度维度的“正常区间“以男性样本为参照组。工作记忆广幅中,数据集中女性被试的比例远低于其在总植入人口中的占比,数据集在性别维度上存在显著的代表性偏差。适应性学习速率维度的原始校准数据集甚至只包含了不足一定比例的女性被试——不足比例不是抽样误差——是因为早期神经接口的临床试验阶段女性被试总体招募不足,而这个阶段的基线数据被沿用至今。
孟正则把铅笔放在桌上——这回动作比在联席会议上那次更轻,因为他不需要任何人注意。
他在报告扉页的空白处写了一段铅笔字。字迹比他平时写得更密——每一行的间距被压缩到了几乎不可读的距离。
“飞升积分在谷雨表决时被定位为''让效能透明''——透明的前提是标尺本身的刻度是平的。如果标尺在出厂时就已经有了系统性的倾角,透明就是把倾斜变成所有人都可以看到的永久差距。这不是技术缺陷——技术可以在下一个版本更新中调整校准参数。这是制度缺陷——在几轮前期评估中,没有任何一个环节的设计要求核查校准数据集是否在性别维度上具有统计学意义的代表性。不是刻意歧视——是没有人想到要去查。不查的原因比歧视更让我无法忍受——因为女性在早期的义体临床试验中被纳入得不够多——这本身是历史结构造成的——然后这个历史偏差被训练数据完好地继承并被飞升积分放大为效能评分——到了这一层——它已经不是偏差——是你被出生时随机分配到的生理性别通过两次技术转换——先转换为校准数据集的缺口——再转换为缺省分——决定了你在效能排行榜上的起始位置。“
他写完这段话后把铅笔放下,站起来走到窗前。窗外长安街上的梧桐和银杏在小暑前一天的热风中被摇得叶片的正面和背面反复翻覆——阳光打在叶片正面和背面的颜色不一样——正面是油亮的深绿,背面是略灰的淡绿色。一棵树的每一片叶子在不同角度反射不同的光——但效能评估把所有这些不同压成了一个数。
他把铅笔那段话撕下来——没有销毁,没有放进密码柜——把它夹在笔记本中上一次关于公约第二十一条和飞升积分的那页纸旁边。两张纸——一张是关于公约在几年后可能触碰到的位置,一张是关于校准数据在几年前就已经偏离的起点。过去和未来的偏差被同一个人的铅笔夹在了同一本笔记本的相邻两页。
然后他在核查报告的正式批语栏中用钢笔写了批语。笔迹恢复了官方的端正——笔锋不再有上翘的痕迹。
“技术标准司——请将核查第一阶段发现的校准数据集性别偏误全部列入标准修订案的校准附录。在修订案定稿前,任何使用存在明确性别偏误校准数据的评估框架所输出的效能分数,不得作为飞升积分制在公共资源分配中的所有授权性决定的唯一参考依据。''不得作为唯一依据''的措辞应与公约第二十一条补充条款的法理结构保持一致——不禁止效能分数的计算和公布——但禁止未经验证的效能排序在涉及公民权利分配时扮演排他性角色。请在一周之内将本期核查中确认存在偏误的几个维度和对应数据集清单汇总,报法工委备案——与护栏数据平台的金融扩展限制条目进行交叉索引。“
他把批完的报告装回机要信封,用封口线封好。然后拿起桌上那支笔尖不太尖的铅笔在自己的笔记本空白页上慢慢画了一条水平横线——线的一端标着“公约“,另一端标着“校准“。这条线是平的吗?不是——他用手指从一端往另一端推了推,感觉纸上的横线在手温下似乎有一点点微微的上斜——不是水平,是略有斜度。他没有用尺子量——他在线旁边加了一句话。
“公约在门的侧面——校准在在门的底面上——门框是平的吗。如果底面不平——门扇本身在合上前就已经有了倾角。门框两侧的法律语言可以精确到每一个字——底面的历史数据偏差已经在几十年的临床试验入组偏差中被写进了基线。校准不是法律——是历史数据在当下的反诉。“
他把笔记本合上,装进公文包。窗外小暑前一天傍晚的风已经把梧桐叶吹得哗啦哗啦地响——不是秋天那种沙哑的干响,是夏天叶片饱含水分的沉闷拍击。一片梧桐叶在风的末端脱落了——不是因为干枯——是叶柄和枝条之间的离层在高温下提前被激活了。叶片还在绿着——但它已经和树不再相连。孟正则看着那片叶子从三层楼的高度斜斜地落下去。他在想——校准偏差也是这样一个离层——不是在叶子和枝条之间,是在基准面和被测量的人之间。你看不见它——直到有人拿着独立核查的统计报告一片一片地量了每一片叶子脱落时的颜色。
小暑当天,林知行在社科院的办公室里收到了一份来自京都社区互助组织的邮件。邮件不是发给他的——是陈岚在一次互助会后群发的活动总结,抄送列表里包括了所有她认识的可能对“照护劳动在义体社会中的处境“这个议题有专业兴趣的研究者。林知行在被抄送栏里看到自己的邮箱地址时愣了一下——他的专业是劳动社会学,但他和陈岚从未直接通过信。他们只是通过中间人——可能是那个在立夏互助会上发言的大学老师——间接地感知到对方的存在。
陈岚的活动总结写得不长。但她在正文结尾处专门用了一个自然段来描述一个互助会参与者在会上提出的照护问题。
“周三晚上一位姓沈的女士第一次参加互助会。她没有植入——是替她母亲来问一个问题。她母亲今年早些时候——在第三根肋骨到锁骨之间的区域接受了神经接口植入——为了治疗颈椎损伤导致的右上肢活动障碍。手术是公费——植入之后的运动功能恢复超出了预期。但上个月她母亲被转到了一个术后长期跟踪的数据库中——数据库为她生成了一个术后效能评估分。
“问题是——她母亲今年已经超过六十五周岁——退休在家,每天大概需要花大约四到六个小时照顾她父亲。她的父亲因为帕金森症手抖不能自己完成全部进食——需要她母亲把调羹慢慢送到嘴边,用另一只手托着父亲的下巴稳定角度——然后等他完成咀嚼——一次大约三到四分钟。每顿饭需要大约半小时到四十分钟。一天需要三顿——有时晚上加一杯牛奶。这个过程中没有''效能''——调羹递出的速度不能按毫秒优化——手托下巴的力度不能按百分比调整——咀嚼等待的时间不能压缩。照护是没有效能的——它是对时间的完整占用——你的手在做一件事时不能被任何其他任务打断——你的注意力不能分散——你的速度不能提高——如果你加速了——你父亲会呛到。
“她母亲的效能评估分在''任务并行处理''维度上被评为偏低——因为她的日常生活没有产生可以被效能评估量表识别为''并行任务''的行为记录。她没有并行任务——她的任务全部是顺序性的——不可断裂——不可压缩——不以速度计量的照护。评估系统把她生活的整个时间结构判定为''低结构复杂度''。她的效能分在''适应性学习速率''维度上也偏低——因为她没有接触过需要''适应性学习''的新技能——她每天重复同一个送调羹的弧度——同一个托下巴的力度——已经重复了很多年。系统判定——她没有学习——因为她没有变化。照护的本质就是对不变的事物反复做着同一个动作——不是缺乏学习能力——是爱的动作不需要更新。“
林知行读了这段话两遍。他在邮件打印件上用红笔写道——“照护活动的全部特征与效能评估的全部维度在底层逻辑上呈系统性对立——稳定性被判定为低适应速率,顺序性被判定为低并行能力,重复性被判定为无学习。这不是测量误差——是效能这个概念在定义什么是''有用''的时候已经排除了照护。“
他停顿了一下,在下面加了更小的一行字——“但她的父亲需要一个能把调羹准准地送到他嘴边的人——不是需要一个人在一毫秒之内把调羹送到嘴边。如果没有人把调羹稳稳地送到他嘴边——效能评分再高的人来了也没用。因为帕金森症患者的吞咽节奏不接受优化。“