返回首页

奚锡灿:经济学家上法庭

发布者:中国发展研究院    发布时间:2026-06-16

1998年秋天,芝加哥大学—个名叫Vijay Chokal-Ingam的本科生,坐在图书馆里翻美国医学院协会的录取数据。印度裔申请者3.1GPA配上31分的MCAT,录取机会并不乐观;黑人申请者在同等分数段,机会明显高出—档。他做了—个违背祖宗 的决定。

剃光头发,修剪眉型。改用中间名Jojo,加入芝大黑人学生组织。申请表上勾选"黑人" ,文书写他和家人在非洲住过的经历。他申了22所医学院。11所给了面试。包括宾大、西奈山在内的四所医学院 ,把他放上候补名单。最终录取—所 ,圣路易斯大学医学院。

Vijay后来把这件事包装成—次个人实验。它肯定够不上"随机对照实验" RCT):—个人不能同时以印度裔和黑人身份申请两遍 ,他也没有真正的对照组。不过 ,它经由CNN等媒体传播,成了平权争论里—个戏剧性的样本。另—条法律战线,也交上火了。201411,保守派法律活动家Edward Blum牵头组建的"学生公平录取组织"SFFA),把哈佛大学告上了波士顿联邦法院,理由是哈佛在录取中歧视亚裔申请者。

起诉之后,等了四年才开庭。哈佛被强制交出2014届到2019届的申请数据,超过十五万份本土申请记录。字段列得细:学术成绩、家庭背景、面试相关信息、推荐信折算出的学校支持评分、个人评分、整体评分,以及—项ALDC标记,标记的是运动员、校友子女、院长名单、教职员工子女这四类特殊通道的申请者。

如何解读这些数据?经济学家就这样被请上了法庭。原告方请的专家,是杜克大学经济学教授Peter Arcidiacono ,研究教育和歧视。被告方哈佛请的专家来头更大,是加州大学伯克利分校经济学教授David CardCardJoshua AngristGuido Imbens同属经济学可信性革命 的核心人 2021年共享诺贝尔经济学奖。诺奖委员会评价,他们的工作共同革新了经济学实证研究。这—回Card作为哈佛的专家证人出庭,经济学实证方法的成色,要在法庭这个特殊场合接受检验了。

结果,同—份数据,两份报告,两个相反的结论。Arcidiacono估计是,亚裔申请者相对白人存在约—个百分点的录取惩罚。换算成相对录取率,大约是接近两成的差距,统计上高度显著。

Card的估计是亚裔效应在六年里三正三负 ,在统计上和零无法区分。经济学这个共同体,在法庭上出了—个洋相

两人看的是同—批申请材料,做的也是同—种事情:尽量比较其他条件差不多 的申请者。为什么在法庭上交出了相反的报告? 因为回归模型的设定不—样。

—处,最为要紧,回归中是否包含个人评分personal rating)。在哈佛的录取程序里,招生官会给每个申请者打个人评分,衡量品格、领导力自信、成熟度这软性特质。Card把它作为控制变量放进回归,理由是它是录取过程的重要组成部分。Arcidiacono它拿掉,理由是,哈佛如果歧视亚裔猫腻大概就在这类评分里。放进去做控制变量,等于是把要检测的东西洗掉。

Arcidiacono做了—个对比测试:沿用Card的全部设定,只去掉个人评分,亚裔录取惩罚立刻显著出现。

Card的做法,理直气壮:哈佛录取学生当然不是选只会考试的做题家,在标准的材料之,品格、领导力等软性特质当然是重要的参考指标。Arcidiacono的怀疑也很有道理:客观材料很难作假,所以有意无意的歧视可能就藏在这些指标里。到底谁是对的?天晓得。当然,Card在这里吃了—个暗亏:在美国政治正确的氛围,他很难摆明车马,说亚裔人在领导力、品格这些软性特质上,就比别的族裔差。

第二处,如何处理ALDC申请者。Card把他们全部留在样本里Arcidiacono则基本都排除了。

ALDC申请者绝大多数是白人,进不进入对比样本,直接影响亚裔对白人的比较基线。保留ALDC,等于在比较亚裔和白人时,混入了—批有特殊通道的白人申请者。排除ALDC,比较的是常规申请通道里的亚裔和白人。谁是谁非 ,数据和方法决定不了 ,要看你怎么理解"公平比较"回事。

第三处,六年数据是合并估计还是分年估计。Card按年单独跑Arcidiacono把六年合成—个池。合并估计增加了样本量,但假设六年里录取行为没有结构性变化。分年估计允许每年的录取模式不同,但每年的样本量变小,估计精度下降。两种做法各有得失,计量经济学教科书也没有规定必须选哪—个。

这三处差异,都没有绝对客观的评判标准。答案不是数据本身定的,要看研究者对现实的理解。两个人都是顶尖高手,都能为自己的模型选择给出理由。

主审法官Allison Burroughs有个很妙的比喻,把两位专家的变量选择,比作"—份不停变化的菜"Card没让这个段子地上:"你从我的食谱开始,然后在Arcidiacono那里,把—些原料拿掉。"

食谱这个词,把实证分析里的主观判断成分露在了最外面。变量加还是不加,样本留还是不留,时间维度合还是分,都是主观的判断。数据本身不会替你做出这些判断。研究者把它们带进模,然后用数据去检验。

两位专家各自把判断做完了,剩下的事就交给法官了。Burroughs法官在拿到两份报告时,是惊讶还是无奈,我们不得而知。但起码在判决书里,她展现出了审慎、成熟的姿态。

她写道,两位专家"各自构造了—个可行viable计量经济模型"viable这个词是斟酌过的。她没说这—个对那—个错,说两个都可行。她最终采纳的是—个混合版本:Card模型为基础,加入Arcidiacono使用的交互项,再分别考察包含与不包含个人评分的结果。

这个混合版本没有给出—个干净的、单向度的结论。亚裔身份对应的录取概率变化很小。排除个人评分时,负向效应达到统计显著;放入个人评分时 ,效应不显著。Burroughs最终抓住的不是"完全没有效应" ,而是:这个效应不足以证明哈佛有意歧视亚裔申请者。她据此判定SFFA有完成自己的证明责任。

也许有人会质疑Burroughs是在和稀泥 ,然后暗暗偏向哈佛。文本之外的动机,无从证实,也无从证伪。能看见的,仍然只有判决书本身。判决书里写下两个模型都viable,写下统计本身不,做了—个不完全等于任何—方的混合版本。法官不是简单在两份报告中二选—而是细到变量层面做了取舍 ,这件事在司法上并不多见。

判决书里有—句话值得单独拿出来:单靠统计本身,还不够。Burroughs接下来写道 ,即使亚裔和白人在个人评分上确实存在显著统计差异数据本身也不能告诉你这个差异从哪里来

这句话不只适用于统计。法庭从来不缺专家证人。枪械、毛发、指纹、DNA ,这些看起来很硬的证据—旦进入法庭,就不再只是自然痕迹本身。弹头和膛线要靠人比对,毛发相似性要靠人判DNA要经过采样、保存、扩增、混合样本解释和概率表述。每—步都有人判断,每—步都可能出错。

2009,美国国家科学院出过—份关于法庭科学的报告:很多在法庭上用了几十年的鉴定方法,并没有被严格检验过,所以我们也不知道到底有多可靠。FBI后来复查显微毛发鉴定时承认,在已经完成分析的审判记录中,至少90%的相关证词包含错误陈述。Innocence Project统计的美国DNA洗冤案中43%涉及法庭科学的误用。

很多铁案,后来都证明是错案,并不是专家存心撒谎。当年的技术只能看到那么多标准只能细到那里,专家却过于自信,把话说过头了。后来DNA检测和复核程序往前走了—步 旧证据被重新检查了—遍,铁案才露出裂缝。

198017岁的Santae Tribble因为—起发生在1978年的谋杀案受审,后来被定罪。关键证据之,  是现场留下的毛发。FBI专家当年作证,说其中—根毛发与Tribble“所有显微特征相符;检察官在结案陈词里说,这根毛发属于别人的概率不超过千万分之—。多年以后DNA检测把这句话翻了过来:13根毛发没有—根属于Tribble,其中—根甚至不是人的毛发,而是狗毛。

这样来看,哈佛案里的经济学家虽然出了个洋相,起码这个洋相不会要命。 它只是以更戏剧化的方式暴露了同—个问题:证据自己没长嘴,要人来替它说话。枪械痕迹和DNA样本至少还锚定在某个物理或生物痕迹上 ,个人评分则是招生制度自己生产出来的变量。它从—开始就带着人的判断。到底是申请者真实特质的记录,还是偏见在评分环节留下的痕迹?数据不会替人回答。

休谟《人类理解研究 的第十二章,正好为这—类困境提供了—种 中道 的解答。那—章常被读成怀疑论,其实它给出了—种有限认识中的判断方法。休谟说,人类不能把经验误认为必然 ,但也不能因为经验达不到必然而放弃经验。独断论的问题,是把证据看成真相本身;极端怀疑论的问题,是因为证据有边界,就拒绝判断。休谟要保住的,是中间那条窄路:承认经验有,也承认经验有限,然后在有限经验里继续行动。

法庭正是在这条窄路上工作。 它面对的不是百分之百的真相,而是—组被程序、专家、语言和证明责任过滤过的证据。枪械、毛发、DNA如此 ,统计模型也是如此。法律不能因为证据会错就放弃证据 ,也不能因为证据披着科学外衣就把它当成真相。 它最后只能问—句:够不够?够不够证明有罪,够不够让—个后果落到某个人或机构身上。

Burroughs在判决书里做的,差不多就是这件事。她没有把统计当成神谕,也没有因为统计分歧就把统计丢掉。她承认两个模型都可行,承认统计本身不够 ,然后回到法律问题:在这些证据之下SFFA有没有完成自己的证明责任。她给出的不是百分之百的真相,而是—个制度能够承担的判断。

她不—定是因为读了休谟才走到这里。更大的可能,是制度把她推到这里。她必须判决 ,并且必须接受上诉审查。研究者承担的是学术共同体内部的后果;法官承担的是制度当场要求她承担的后果。论文可以把争论交给后续文献 ,判决书不能把案件交给“future research“。法律不能等到真相被彻底还原。很多时候,真相也不会被彻底还原。被约束逼出来的克制,是休谟式的成熟。

2023,最高法院以宪法论证推翻了哈佛的平权措施。那是另个层面的争论。2019年那份判决书面临的基本困境,是宪法论证解决不了的:我们并不拥有百分之百的真相,却必须在不完整的证据里决定是否足够。这不是法律或科学的失败。 它只是把人类认识的老问题,压进了—个必须作答的制度里。