他在当天的笔记本上补了一句:“护栏追不上金融——护栏是靠法律来跑的,金融是靠利润追信号的。两者的速率差——可能是整个框架最不设防的地方。“
芒种后第四天,方涵完成了护栏首次评估的初稿。她把飞升积分试点首轮跟踪数据的全部护栏维度分析写进了一份不到二十页的报告中。报告的核心发现用三句话概括:
第一,不交叉字段出现了若干条来源不明的跨系统查询——已由信息安全中心确认,全部来自省级社保数据端口,目前未发现数据被实质性窃取但查询请求本身在权限上存在程序瑕疵。第二,可撤回——正式退出申请的累计数量不大,但退出者在退出后面临的一个无法被护栏覆盖的非直接代价——部分大型商业银行在他们的内部风控模型中自发地将撤回效能认证的客户标记为“信息不完整“类别。没有制度规定要求他们标记——他们的机器学习风控引擎在缺少效能分段变量时自动降权了对应客户的信贷评级。第三,飞升积分最高分段与最低分段之间的效能差距在首批试点数据中约为百分之几十——但差距的分布与已有的社会层级存在显著重合——高分段集中在受过高等教育的城镇青年和专业技术人员中,低分段集中在未受高等教育的基层劳动者和农业人口中。
方涵在报告的结论部分写道:“护栏目前在直接制度层面上履约良好——不交叉与不可逆条款没有重大违规,可撤回条款在行政程序上可行。但护栏无法覆盖一个更隐蔽的机制——当效能积分被第三方商业机构自发纳入风控模型后,退出效能认证不是恢复到认证前的中立状态,而是被系统冠以''信息不完整''的标记。撤销时公民不受到制度性歧视——但在商业领域,信息不对称本身变成了一种惩罚。退出的代价不是在退出时付出——是在退出后,每次信贷评估看到那个''信息不完整''标签时自动扣除资质。“
她在报告最后一页附了一张手写的便条,是给韩世清的。“部长——这近一个月以来我从数据里看到的最不安的事,比不交叉漏洞更让我不安,是''信息不完整''这个标签。它不是任何人的恶意——它是算法对缺失数据的默认行为。但默认行为在结构中和对人的伤害完全一致——只是它不说。沉默的排除不需要主人——它只要一个默认参数就够了。“
韩世清收到这份初稿后,把手头所有其他文件推到一边,用了整整半天的时间逐段看完。他看完之后给方涵回了一条仅几个字加一个标点的消息——“默认参数——加入护栏扩展提案专门说明。谢谢。“
芒种时节,京都的夏天已经进入了稳定的节奏。每天上午天气晴朗,下午开始升温,傍晚偶尔有短时的局部小雨把梧桐叶上沾了一整天的灰洗掉。长安街两侧的银杏树浓荫密布,树冠层叠,把自行车道上空遮得紧紧的。整条街从南向北看上去像一条绿色的隧洞——隧洞中有一棵银杏树和一个躲在树洞里的构树,各自在自己的层位上安静地长着。
张薇从新加坡飞到布鲁塞尔参加国际神经伦理学会年度会议的那天正是芒种后的第一个周五。她没有做传统的PPT,而是把她在《性别差异作为神经接口排异预测因子》论文中引用的全部原始数据图表逐张展示了一遍——每一张图表都在屏幕上停留了足够长的时间让观众看清横轴和纵坐标的标签。她讲完后没有离开讲台,而是把手放在讲台边缘,微微往前靠了一下,说了一段她事先没有写进稿子里的话。
“我读研究生的时候,我的导师告诉我——数据在数学上不存在任何性别的偏向,因为数字不关心。那时我二十二岁,花了很长时间在试图说服自己——不,他说的不对——但找不到反驳他的证据。现在我找到了。数字确实不关心——但校准数字的默认设置是人选的,人选的是有性别的。当你把一群人赶上前去校准一把尺子——然后没有被摆在秤盘里的另一群人被这把尺子量着——她们每一次被量都是对旧的不公的一次新确认。这不是数字的错。这是校准的默认设置没有一个内置的''谁不在''检查。“
她在讲完这句话时短暂停了一下,然后非常轻声地说——“这个''谁不在''——是我花了很多年才学会问的问题。我没有早一点问——所以现在我把这个问题留给你们。“
在台下坐着的一位老教授——头发全白,戴着厚厚的深度近视眼镜——低头在笔记本上写了好几分钟才写完这几个字。他写完之后合上笔记本,用笔端轻轻敲着他前排座位的椅背——和玛丽亚·冯在布鲁塞尔雨天的敲击差不多是同一种节奏。
当天的晚宴上,玛丽亚·冯端着一杯红茶走到张薇身边。说她已经完成了《神经权利公约》第二十一条补充条款中引证她论文的那一条款在起草小组内部的初步审阅——引用已获通过。张薇问审阅花了多少天。玛丽亚·冯说大概不到十天——在公约修订的时间表中算很快了。张薇说她很感激——但她想问一个问题。玛丽亚·冯点头。
“在不到十天的审阅期间——有多少审阅者注意到我在论文里附录的这个部分——女性在原始校准数据集中代表性不足——不只是一家公司的数据库的问题,而是整个行业早期临床试验的被试招募结构造成的累积偏误——这个问题在后来的十几年中没有被任何监管机构列为校准必须审视的问题。“
玛丽亚·冯沉默了一会儿,然后说——“没有人问过。他们都是男性审阅专家——他们没有意识到这个问题存在。不是他们不愿意看——是他们从来没有被训练过在看校准数据时先问''谁不在''。“
张薇把她的红茶杯轻轻放在桌上,看着晚宴厅窗外的布鲁塞尔夜空。她说她写这篇论文的这些年,最孤独的时刻不是在凌晨对着数据逐行比较p值——是一个人坐在电脑前面反复推敲句子时,忽然意识到她为数以万计的女人写下的每一个统计上显著的差异,在审阅者看来——如果审阅者也是女性的——会是明显的——但在审阅者大多是男性的时候——她必须用一套额外的技术语言,把一个在直觉上极其明显的差异包装成必须经过多变量回归才能被正式验证的结论。不是因为差异不存在——是因为那些只能被女人感知的不匹配在这个专业的共同体中曾经不被视为有效证据——需要被翻译成男人也愿意承认的统计显著性。
她把这段话说完之后,玛丽亚·冯沉默了一会儿,然后用一个极轻的力度——和一个女儿在给妈妈掖被角时几乎相同的力度——碰了一下她自己的手腕。没有解释是什么意思。但张薇认出了那个手势。
芒种进入尾声。飞升积分试点第一批护栏数据引发的内部邮件链在中枢内部流转了好几遍。赵豫章在收到秦铭正式定稿的《排序系统通用护栏准则预研》和方涵首批护栏跟踪评估报告后,用铅笔在两份封面上各自画了一个很轻的圈——和他在最早排异反应数据披露文件封面上画的那个圈差不多大。圈不大,但每次都压在极其精确的几何位置——不偏纸页中心,也不偏页边——在文件编号条右上方那个极小的空白处。
然后在抽屉的底层便签纸上又如往常地写了字,划掉,重新折好。他把两份文件和周雨那幅“芒种:虫孔是光“的照片打印件并排放在一起——一直等到傍晚的光全部暗下去才把它们收进抽屉。
窗外芒种末的暮色中,长安街上那些绿色的隧洞里最后一片阳光正被收进夜的边缘。银杏树和构树在各自的层位上安静地转入夜晚——一条大街,两个物种,共享空气已经很多年了。
夏至将至。那些在春天的每一次小雨中被植入土壤的种子——现在被芒种雨浇灌过了——正从泥土里长出各自的第一片新叶。有些叶子在正面挡住了所有光——挡光意味着健全,也意味着阻断。有些叶子背面有虫孔——残缺意味着透光。
在芒种尽头的这个傍晚,还没有人能把这两个方向的可能性终点完整看清。