- 别拿相关当因果!因果关系简易入门
- (美)萨曼莎·克莱因伯格
- 2683字
- 2020-08-29 01:36:23
第1章 引子
因果关系的概念以及寻找因果关系的方法从何而来?
1999年,一个名叫Sally Clark的英国律师被法庭判定谋杀了她的两个孩子。1996年12月,她的第一个儿子在11周大的时候突然死亡。当时,人们认为孩子是自然死亡。但是就在第一个孩子夭折一年多以后,Clark的第二个儿子又在8周大的时候死亡了。在这两个案件中,两个孩子似乎都没有什么生理上的疾病。于是,他们的突然死亡引起了人们的怀疑。
这两个案件有很多共同之处:孩子们死的时候年龄差不多,他们的死都是由Clark发现的,当时家里只有Clark和孩子在一起,而且验尸报告表明两个孩子身上都有伤。一开始,人们认为第一个孩子的伤是抢救时造成的。但是,第二个孩子死后,人们对孩子的伤重新做了检查,而这一次他们认为这些伤很可疑。第二个孩子死亡四周后,警方逮捕了孩子的父母,随后Clark被指控为谋杀罪并获刑。
同一个家庭的两个婴儿都死于婴儿猝死综合征(SIDS)的概率有多大?据英国检察官称,发生这种情况的可能性微乎其微,所以这两起死亡一定是谋杀所致。这一论据(一个原因的可能性几乎为零,所以一定还有另外一个原因)造成了这桩著名的冤案。这也是因为统计不当和忽视因果关系而造成严重后果的一个重要案例。
统计学家和因果关系研究者都知道这个案例,其主要原因在于,检方的论据本质上基于这样的逻辑:被告的辩词几乎不可能为真,所以一定是假的。检方为此请来了一位专家证人——Roy Meadow博士。Meadow称,同一个家庭发生两起SIDS事件的概率为七千三百万分之一。检方由此认为,因为这个概率非常低,所以这两起死亡事件不可能出于自然原因,一定是谋杀所致。
然而,这一统计数据完全是错误的。即使这个数据是正确的,也不应该这样用。有一份研究报告估算出发生SIDS的概率为1/8543。Meadow根据这个研究报告提出:同一个家庭发生两起SIDS事件的概率为1/(8543×8543),即约七千三百万分之一。1这种计算方法错误的原因在于,它假定这些事件是相互独立的。抛硬币的时候,无论硬币落地时是正面朝上还是反面朝上,都不会对下一次结果产生任何影响。因为每一次硬币正面朝上的概率都是1/2,所以将第一次正面朝上的概率与第二次正面朝上的概率相乘所得出的结果就是连续两次正面朝上的概率,这从数学角度来讲是没有问题的。Meadow当时也是这样计算的。
引发SIDS的原因还不确定,但一个很重要的影响因素是孩子所处的环境(比如家里是否有人吸烟和饮酒)。这意味着,如果一个家庭发生过一起SIDS,那么这个家庭发生第二起SIDS的概率就会远大于1/8543,因为这些孩子的生活环境和遗传基因都是相同的。也就是说,第一起死亡事件会向我们透露第二起死亡事件发生的概率。这个案例和一名演员获得两次奥斯卡金像奖的情况非常相似。金像奖并不是随机颁发的,演员第一次得奖时具备的品质(才华、知名度、人脉)会提高他再次得奖的可能性。
这就是Clark一案的症结所在。在这个案子中,两起事件并不是相互独立的,可能还是共同的原因引发的。因此,不能通过简单的乘法来计算这两起事件发生的概率。相反,在计算第二起事件发生的概率时,应该考虑到第一起事件的发生。所以我们需要知道的是,在一个已经发生过一起SIDS事件的家庭中,发生第二起SIDS事件的概率。本案中的概率在计算和使用方面都存在十分严重的问题,为此,被告在第一次上诉时请来了一位统计学家作为专家证人,皇家统计学会还专门写了一封信表达了他们对这个案件的关心。2
不过此案的问题并不仅仅是误算概率那么简单。在整个案件中,检方试图将事件(即这两起SIDS死亡事件)发生的这七千三百万分之一的概率等同于Clark无罪的概率。这种错误的推理将事件发生的概率当成了被告有罪或者无罪的概率,这就是我们所说的检察官谬误。3
我们知道,一个几乎不可能发生的事件真的发生了。一个家庭中发生两起SIDS死亡事件的可能性很小,但是一个家庭中两个婴儿都夭折的可能性也很小。人们不单单会考虑SIDS这一解释是否合理,更重要的是,他们会将其与关于这个事件的其他解释进行比较。因此在这个案件中,最好将同一个家庭中两个孩子都被谋杀(检方的假设)的可能性与同一家庭中两个孩子都患了SIDS的可能性进行比较。
一个家庭中两个孩子都死于SIDS的概率与这两个孩子都感染的概率是不同的。关于这个案件我们还有其他的证据,比如物证和犯罪动机等。必须将这些证据与概率结合起来看(比如说,一个人如果没有犯罪动机、没有作案机会或者没有行凶武器,那么他杀人的概率肯定要低于总谋杀率)。4
最后,无论一件事情发生的概率有多低,只要尝试的次数足够多,最后一定会发生。Clark一案中,那个误算出来的极低的概率(七千三百万分之一)比中百万大博彩的概率(二亿五千八百万分之一)还要高三倍多。一个人中大奖的概率是极低的,但是如果我们说某个地方的某个人会中大奖,这个概率又如何呢?那就高得多了。这就说明,仅通过概率来判断一个人的清白一定会导致一些冤案。这是因为虽然对某个特定的家庭来说,发生这种事件的可能性很小,但是世界上有两个孩子的家庭有上百万个,这种事件总会在某个地方的某个家庭发生。
2003年1月,Clark第二次上诉时终于翻案。然而,那时她已经在监狱服刑三年了。
为什么Clark案会成为因果推理失败的重要案例呢?尽管此案在计算概率的过程中存在很多问题,但最根本的原因是,此案试图用一个事件发生的概率来支撑某个特定的因果结论。“这只是巧合而已”“这个概率有多大”,当你在说服别人相信某个因果关系时,是否也说过这样的话呢?生活中经常有这样的推理:公司来了一名新员工,而同一天你的订书机不见了;一名巫师知道你最喜欢的女性亲属的名字以“M”开头;两名重要人证记得那名嫌犯穿的是一件红色法兰绒衬衫。但是,如果因某件事情不大可能发生,而说其唯一合理的解释就是因果关系,那一定是错误的。前面已经说过,一个不大可能发生的事件在某个人身上发生的概率也许极低,但是在某个地方发生的概率却不低。除了会造成冤案以外,错误的因果推理还可能会带来其他严重的后果,比如将大量的时间和精力浪费在绝不可能起作用的药品上,或者制定一些无用的、代价高昂的公共政策。
本书的目的是提高读者的因果推理能力。严谨的因果思维是指质疑假设、衡量证据、分析各种说辞,以及辨别我们无法得知事情发生原因的情况。有时我们可能无法获得足够的信息来建立因果联系,有时我们获得的信息可能并不是我们所需要的,但重要的是能够认识到这些问题,并与其他人就这些问题进行交流。通过阅读本书,我希望读者至少能够对他们所听到的各种因果推论多一些质疑(我们将讨论在因果推论中需要注意哪些危险信号,以及可以提出哪些问题来衡量这些推论),但首先我们会教大家如何寻找事件发生的原因、如何为因果关系提供强有力的证据,以及如何使用因果关系来指导我们日后的行为。