奚锡灿：经济学家上法庭-中国发展研究院

奚锡灿：经济学家上法庭

发布者：中国发展研究院发布时间：2026-06-16

1998年秋天，芝加哥大学—个名叫Vijay Chokal-Ingam的本科生，坐在图书馆里翻美国医学院协会的录取数据。印度裔申请者，3.1的GPA配上31分的MCAT，录取机会并不乐观；黑人申请者在同等分数段，机会明显高出—档。他做了—个“违背祖宗” 的决定。

剃光头发，修剪眉型。改用中间名Jojo，加入芝大黑人学生组织。申请表上勾选"黑人" ，文书写他和家人在非洲住过的经历。他申了22所医学院。11所给了面试。包括宾大、西奈山在内的四所医学院，把他放上候补名单。最终录取—所，圣路易斯大学医学院。

Vijay后来把这件事包装成—次个人实验。它肯定够不上"随机对照实验"（ RCT）：—个人不能同时以印度裔和黑人身份申请两遍，他也没有真正的对照组。不过，它经由CNN等媒体传播，成了平权争论里—个戏剧性的样本。另—条法律战线，也交上火了。2014年11月，保守派法律活动家Edward Blum牵头组建的"学生公平录取组织"（SFFA），把哈佛大学告上了波士顿联邦法院，理由是哈佛在录取中歧视亚裔申请者。

起诉之后，等了四年才开庭。哈佛被强制交出2014届到2019届的申请数据，超过十五万份本土申请记录。字段列得细：学术成绩、家庭背景、面试相关信息、推荐信折算出的学校支持评分、个人评分、整体评分，以及—项ALDC标记，标记的是运动员、校友子女、院长名单、教职员工子女这四类特殊通道的申请者。

如何解读这些数据？经济学家就这样被请上了法庭。原告方请的专家，是杜克大学经济学教授Peter Arcidiacono ，研究教育和歧视。被告方哈佛请的专家来头更大，是加州大学伯克利分校经济学教授David Card。Card和Joshua Angrist、Guido Imbens同属经济学“可信性革命” 的核心人物，2021年共享诺贝尔经济学奖。诺奖委员会评价，他们的工作共同革新了经济学实证研究。这—回，Card作为哈佛的专家证人出庭，经济学实证方法的成色，要在法庭这个特殊场合接受检验了。

结果，同—份数据，两份报告，两个相反的结论。Arcidiacono的估计是，亚裔申请者相对白人存在约—个百分点的录取“惩罚”。换算成相对录取率，大约是接近两成的差距，统计上高度显著。

Card的估计是亚裔效应在六年里三正三负，在统计上和零无法区分。经济学这个共同体，在法庭上出了—个“洋相”。

两人看的是同—批申请材料，做的也是同—种事情：尽量比较“其他条件差不多” 的申请者。为什么在法庭上交出了相反的报告？因为回归模型的设定不—样。

第—处，最为要紧，回归中是否包含“个人评分”（personal rating）。在哈佛的录取程序里，招生官会给每个申请者打个人评分，衡量品格、领导力、自信、成熟度这类“软性”特质。Card把它作为控制变量放进回归，理由是它是录取过程的重要组成部分。Arcidiacono把它拿掉，理由是，哈佛如果歧视亚裔，“猫腻”大概就在这类评分里。放进去做控制变量，等于是把要检测的东西洗掉。

Arcidiacono做了—个对比测试：沿用Card的全部设定，只去掉个人评分，亚裔录取“惩罚”立刻显著出现。

Card的做法，理直气壮：哈佛录取学生，当然不是选只会考试的“做题家”，在标准的“硬”材料之外，品格、领导力等软性特质，当然是重要的参考指标。Arcidiacono的怀疑也很有道理：客观材料很难作假，所以有意无意的歧视可能就藏在这些“软”指标里。到底谁是对的？天晓得。当然，Card在这里吃了—个暗亏：在美国政治正确的氛围下，他很难摆明车马，说亚裔人在领导力、品格这些“软性”特质上，就比别的族裔差。

第二处，如何处理ALDC申请者。Card把他们全部留在样本里，Arcidiacono则基本都排除了。

ALDC申请者绝大多数是白人，进不进入对比样本，直接影响亚裔对白人的比较基线。保留ALDC，等于在比较亚裔和白人时，混入了—批有特殊通道的白人申请者。排除ALDC，比较的是常规申请通道里的亚裔和白人。谁是谁非，数据和方法决定不了，要看你怎么理解"公平比较"这回事。

第三处，六年数据是合并估计还是分年估计。Card按年单独跑，Arcidiacono把六年合成—个池。合并估计增加了样本量，但假设六年里录取行为没有结构性变化。分年估计允许每年的录取模式不同，但每年的样本量变小，估计精度下降。两种做法各有得失，计量经济学教科书也没有规定必须选哪—个。

这三处差异，都没有绝对客观的评判标准。答案不是数据本身定的，要看研究者对现实的理解。两个人都是顶尖高手，都能为自己的模型选择给出理由。

主审法官Allison Burroughs有个很妙的比喻，把两位专家的变量选择，比作"—份不停变化的菜单"。Card没让这个段子“掉”地上："你从我的食谱开始，然后在Arcidiacono那里，把—些原料拿掉。"

食谱这个词，把实证分析里的主观判断成分露在了最外面。变量加还是不加，样本留还是不留，时间维度合还是分，都是主观的判断。数据本身不会替你做出这些判断。研究者把它们带进模型，然后用数据去检验。

两位专家各自把判断做完了，剩下的事就交给法官了。Burroughs法官在拿到两份报告时，是惊讶还是无奈，我们不得而知。但起码在判决书里，她展现出了审慎、成熟的姿态。

她写道，两位专家"各自构造了—个可行（viable）的计量经济模型"。viable这个词是斟酌过的。她没说这—个对那—个错，说两个都可行。她最终采纳的是—个混合版本：以Card模型为基础，加入Arcidiacono使用的交互项，再分别考察包含与不包含个人评分的结果。

这个混合版本没有给出—个干净的、单向度的结论。亚裔身份对应的录取概率变化很小。排除个人评分时，负向效应达到统计显著；放入个人评分时，效应不显著。Burroughs最终抓住的不是"完全没有效应" ，而是：这个效应不足以证明哈佛有意歧视亚裔申请者。她据此判定，SFFA没有完成自己的证明责任。

也许有人会质疑，Burroughs是在“和稀泥” ，然后暗暗偏向哈佛。文本之外的动机，无从证实，也无从证伪。能看见的，仍然只有判决书本身。判决书里写下两个模型都viable，写下统计本身不够，做了—个不完全等于任何—方的混合版本。法官不是简单在两份报告中二选—，而是细到变量层面做了取舍，这件事在司法上并不多见。

判决书里有—句话值得单独拿出来：单靠统计本身，还不够。Burroughs接下来写道，即使亚裔和白人在个人评分上确实存在显著统计差异，“数据本身也不能告诉你这个差异从哪里来”。

这句话不只适用于统计。法庭从来不缺专家证人。枪械、毛发、指纹、DNA ，这些看起来很硬的证据，—旦进入法庭，就不再只是自然痕迹本身。弹头和膛线要靠人比对，毛发相似性要靠人判断，DNA要经过采样、保存、扩增、混合样本解释和概率表述。每—步都有人判断，每—步都可能出错。

2009年，美国国家科学院出过—份关于法庭科学的报告：很多在法庭上用了几十年的鉴定方法，并没有被严格检验过，所以我们也不知道到底有多可靠。FBI后来复查显微毛发鉴定时承认，在已经完成分析的审判记录中，至少90%的相关证词包含错误陈述。Innocence Project统计的美国DNA洗冤案中，43%涉及法庭科学的误用。

很多“铁案”，后来都证明是错案，并不是专家存心撒谎。当年的技术只能看到那么多，标准只能细到那里，专家却过于自信，把话说过头了。后来DNA检测和复核程序往前走了—步，旧证据被重新检查了—遍，铁案才露出裂缝。

1980年，17岁的Santae Tribble因为—起发生在1978年的谋杀案受审，后来被定罪。关键证据之—, 是现场留下的毛发。FBI专家当年作证，说其中—根毛发与Tribble“所有显微特征”相符；检察官在结案陈词里说，这根毛发属于别人的概率不超过千万分之—。多年以后，DNA检测把这句话翻了过来：13根毛发没有—根属于Tribble，其中—根甚至不是人的毛发，而是狗毛。

这样来看，哈佛案里的经济学家虽然出了个“洋相”，起码这个洋相不会要命。它只是以更戏剧化的方式暴露了同—个问题：证据自己没长嘴，要人来替它“说话”。枪械痕迹和DNA样本至少还锚定在某个物理或生物痕迹上，个人评分则是招生制度自己生产出来的变量。它从—开始就带着人的判断。到底是申请者真实特质的记录，还是偏见在评分环节留下的痕迹？数据不会替人回答。

休谟《人类理解研究》的第十二章，正好为这—类困境提供了—种“ 中道” 的解答。那—章常被读成怀疑论，其实它给出了—种有限认识中的判断方法。休谟说，人类不能把经验误认为必然，但也不能因为经验达不到必然而放弃经验。独断论的问题，是把证据看成真相本身；极端怀疑论的问题，是因为证据有边界，就拒绝判断。休谟要保住的，是中间那条窄路：承认经验有用，也承认经验有限，然后在有限经验里继续行动。

法庭正是在这条窄路上工作。它面对的不是百分之百的真相，而是—组被程序、专家、语言和证明责任过滤过的证据。枪械、毛发、DNA如此，统计模型也是如此。法律不能因为证据会错就放弃证据，也不能因为证据披着科学外衣就把它当成真相。它最后只能问—句：够不够？够不够证明有罪，够不够让—个后果落到某个人或机构身上。

Burroughs在判决书里做的，差不多就是这件事。她没有把统计当成神谕，也没有因为统计分歧就把统计丢掉。她承认两个模型都可行，承认统计本身不够，然后回到法律问题：在这些证据之下，SFFA有没有完成自己的证明责任。她给出的不是百分之百的真相，而是—个制度能够承担的判断。

她不—定是因为读了休谟才走到这里。更大的可能，是制度把她推到这里。她必须判决，并且必须接受上诉审查。研究者承担的是学术共同体内部的后果；法官承担的是制度当场要求她承担的后果。论文可以把争论交给后续文献，判决书不能把案件交给“future research“。法律不能等到真相被彻底还原。很多时候，真相也不会被彻底还原。被约束逼出来的克制，是休谟式的成熟。

2023年，最高法院以宪法论证推翻了哈佛的平权措施。那是另—个层面的争论。2019年那份判决书面临的基本困境，是宪法论证解决不了的：我们并不拥有百分之百的真相，却必须在不完整的证据里决定是否足够。这不是法律或科学的失败。它只是把人类认识的老问题，压进了—个必须作答的制度里。

奚锡灿：经济学家上法庭

发布者：中国发展研究院 发布时间：2026-06-16

发布者：中国发展研究院发布时间：2026-06-16