芒种前一周,方涵收到了飞升积分制试点的第一批跟踪评估数据。
数据包由工信部信息中心从几个试点省份的省级登记系统逐省汇总而来,加密传输,解压后的原始数据量不大——试点才刚刚启动一轮,覆盖的省和企业数量有限,很多字段还是空白。但已经有足够多的数据点可以让方涵开始做一些初步的对比。
她在教育部办公室里把数据包逐表解压,在双屏显示器的左边打开原始数据表,右边打开她几周前建立的那张护栏跟踪评估表。表的首行仍然只有那两个字——“护栏“,是她从小满闭门报告回来那天晚上打上去的。下面是空的字段:不交叉合规率、不可逆合规率、可撤回合规率——每一列对应韩世清提出、她逐条起草的三条基本原则。
方涵的工作方式是从不先看排名分布。她先看护栏。她用了一个上午逐一核对了已返回数据中所有涉及“效能数据跨系统调用“的条目——赋分制的退回评估系统是否被飞升积分的效能数据库以任何方式查询过。她在“不交叉合规率“一栏中标记了每一个被检测到的查询请求的时间戳和来源系统。然后把其中来源不明的查询逐一筛选出来,标成红色。
下午她打电话给韩世清。用的是私人手机——不是加密内线——她在电话刚接通时说她已经把首批护栏数据过了一遍,不交叉方面有一些无法解释的查询来自飞升积分试点省份的省级社保数据库端口。问韩世清是否能帮忙确认这些端口是否在技术上被授权了跨系统查询。韩世清说他会请信息安全中心配合——需要时间。方涵说可以——她现在打电话只是确认这些端口存在。他说那就够了。
挂了电话,方涵在护栏跟踪评估表的“不交叉“一列中标注了那几条待确认的查询链路,标为橙色。然后她才开始看排名分布本身——效能积分的首批全样本分布直方图。直方图右尾很窄——最右侧的几个积分极高的个体都是企业高管和技术骨干,在试点之前已经在各自公司的内部效能排行榜上名列前茅。左尾比较宽——分布集中在中间偏低的位置,没有出现极度落后的超低分个案,但积分最低的一组在年龄和行业分布上有一个明显的特征:主要集中在制造业的中年工人和服务业的基层从业者。
她在这个格子上画了一个圈——和韩世清在所有季度评估简报上画的圈差不多大。
然后她翻到数据包最后几页——试点参与者的退出申请记录。退出的绝对数量不大——试点覆盖面本身不大——但退出人群的特征让她把铅笔拿了起来。退出申请主要来自三个群体:效能分被自动公开后发现自己排在同事视线中的中年基层员工、效能认证中出现排异相关短期波动的植入者、以及有未成年子女且子女尚未植入的家庭中父母一方。最后一个群体的人数不多,但退出申请中附带了一个她在数据表中无法量化的备注字段——“本人退出效能认证,但请确认是否会影响子女在学校的效能数据关联。“
方涵在这个备注旁边打了一个很小的问号——用铅笔,不是红笔。她没有现成的答案。她把问号留在那里。
芒种前两天,张薇的论文《性别差异作为神经接口排异预测因子:多中心随访数据的初步证据》在日内瓦的一份国际同行评议期刊上正式发表了。
这篇论文在她草稿箱里躺了很久。收件人的位置直到最后也是空的——不是因为她不敢发,是因为她一直在等一个合适的时机把附录B中涉及的亚洲几个国家的数据授权条款逐一逐条清理完毕。那些数据的采集跨越了不同的伦理审批框架和不同版本的数据使用协议——有些亚洲国家的研究伦理委员会不允许匿名数据被用于跨国比较研究,除非研究对象本人签署了专门针对跨国分享的补充同意书。张薇花了很长时间才把所有法律文件补齐。她在论文的致谢部分写了很简短的一段话——“感谢所有在签署同意书时不知道自己正在为这篇论文提供数据的被试。你们之中大多数人和我永远不会见面——但能使用你们的数据是我的荣誉。“
论文的核心论点是她在中科院内部数据库摘要中早已阐述过的那个论点:在多中心匿名化长期随访数据库中,女性在排异反应发生率、排异严重程度和排异持续时间三个维度上均高于男性。论文不仅给出了统计显著性——她还在讨论部分专门写了一节对现有效能评估量表的校准假设做深入的技术分析。她的措辞极其谨慎——每一句话都在经过法律顾问的审核之后又做了补充修改。
她写道:“当前所有在国际上被主流神经科技公司和各国监管机构备案使用的效能评估量表的默认校准数据集,均以男性被试为主导——女性在原始校准样本中的占比与总体女性植入者的人口比例不匹配。这种不匹配并非任何特定个人或机构的恶意排除——它是神经接口早期临床试验中女性被试招募的历史性不足与数据集累积偏差共同造成的。“
“但这不改变一个结构性后果:当以男性为主导的数据集校准出来的效能评估量表被应用到混合性别人群中时,女性在排异期的效能下降将在未经任何性别校正的情况下被放大评估。排异期时长、排异严重程度与效能下降率的性别差异被量表的不匹配进一步偏置——结果是女性在排异期的效能分在单次评估中表现得更低,而评估系统将这一差异解读为''效能偏低''而非''量表校准不匹配''。“
论文发表后不到几天,日内瓦的国际神经伦理学会通过邮件向她发出了正式邀请——请她在学会今年的年度会议上做特邀主题报告,报告题目由她自定。她回复了接受,附了报告题目——“被不可见偏误构成的公平:效能评估量表与性别数据的结构性不对称。“
同一天,玛丽亚·冯在布鲁塞尔的欧盟委员会伦理工作组内部引用平台上看到了这篇论文的预印本。她把张薇论文的全文下载下来逐段读完,然后把论文引用进《神经权利公约》修订草案的附录——作为第二十一条补充条款中关于“非中立性效能标准“的证据材料之一。她在引用说明中写了一句话:“如果一项制度所使用的测量工具在默认校准假设中存在性别偏误,那么该制度所产生的一切排名在技术上不满足公平准入条件——不是因为排名不公平,是因为排名所使用的尺子本身的量纲在不同的性别群体中不具有完全一致的有效对标值。“
她将这段引用说明的草稿发送给张薇,征求作者同意。张薇在看到邮件时愣了一下。第二个感觉是——玛丽亚·冯做的事是她自己一直在想但没有权力做的事。不是引用——引用她自己是第一作者,她可以自己发邮件请求任何期刊引用。让她停顿的是另一件事:玛丽亚·冯是在制定国际公约的过程中将她的数据从一个学术数据库变成了制度可引用的法理基础。不是在学术期刊上引用她的p值——是在法律文本的附录中把她的发现转化为修订条款的实证支撑。这两者之间跨度的距离比她之前估计的要短很多。
芒种前一天,韩世清和秦铭在法工委的一间会议室里完成了飞升积分制试点与赋分制关系界定的立法预研框架定稿。自从小满闭门报告之后,韩世清在电话里对秦铭说了很多——不是命令,是思想。他说赵豫章在闭门报告里把护栏这个词变成了一个系统性的概念——不是一次性的政策选项,是任何排序系统必须内嵌的退出与缓冲制度。他建议秦铭在起草框架时将三个护栏原则不只写作赋分制与飞升积分之间的边界条款,而是写成一个“排序系统通用护栏准则“——准则的适用范围不限于当前试点,而是任何一个未来可能被设计出来的、以比较排序为基础的社会制度。
秦铭在那通电话之后把自己关在法工委微型研讨室里,对着那份已经写了好几天的框架稿反复推敲。他保留了原来用星号标记的“强制性定期再校准条款“——并将它的适用范围从赋分制和飞升积分扩大为“所有涉及长期持续比较排序的社会制度体系“。他在条款措辞中小心翼翼地避开所有可能在后续立法辩论中被攻击为“否定竞争“的措辞——他不是否定竞争,他是让竞争在护栏内运行。
最后他在框架附录中新增了一个简短的分节——“护栏的定义与哲学根基“。他在这节开头写道:“本框架中的''护栏''概念在中枢内部闭门形势通报期间由个别领导者在特定语境下做了明确的系统阐述。该阐述的哲学价值在于——它不试图遏制比较,它承认比较的数学规律——它为在比较的持续运行中保障不被排斥的权利提供制度化的出路。护栏不是排斥比较——是对比较的伦理无害化。“