2.5.2 被选数据的骗局

除了数据之间的因果关系问题,还有一类具有欺骗性的数据现象,它与被选数据的概率有关。

让我们来讨论一下扑克游戏。假设我们从一副扑克牌中随机抽出5张牌,这5张牌是同花顺——黑桃10、黑桃J、黑桃Q、黑桃K、黑桃A,是不是觉得特别幸运?毕竟拿到这把牌的概率只有300万分之一。

不过更神奇的是,现在假设抽出的5张牌不是同花顺,而是随机的5张——比如红桃3、方片4、黑桃7、梅花J、黑桃2。仅仅计算概率的话,抓到这些牌的概率同样是300万分之一。这似乎表明了,5张牌无论是同花顺还是随机牌,它们出现的概率都是相同的。

要解释这个现象,我们要回到概率本身的定义。问题出在,当我们看到牌后,无论我们拥有的是同花顺,还是一副随机的牌,拥有这把牌的概率都是1,因为它是确定的,此时再来预测拿牌概率不仅不神奇,也没有意义。只有在没有拿牌的时候,讨论特定牌的概率才有意义,因为此时抽出什么牌是不确定的。

你看,概率问题其实并不难,但在实际场景里并不是所有人都想得明白。正因为如此,它很可能被人利用,制造出一些数据骗局。

举个例子,如果某位专家说他能预测股票走势,那么你是否会相信他?一开始你肯定不信,于是他开始向你证明他的预测能力。他随机挑选了一只股票,并告诉你这只股票明天会涨。到了明天,这只股票真的涨了,此时你相信他吗?还是不信,没关系。在接下来的10天,这位专家每天都预测第二天这只股票是涨还是跌,并且每次都预测对了,此时你会相信他吗?你可能会想,这个人要么有着独到的眼光,要么是有什么内幕消息,不然怎么会连续10天都预测对呢?这个概率简直太低了。

请等一下,你这么想可就错了。还记得我们一开始提到的抽牌概率问题吗?这位专家准确预测股票的概率到底是不是很低,可要先打个问号,因为在这场骗局中,你或许只是那个幸存者。

如果某人连续10天收到和市场相符的预测信息,那么他或许只是幸存者,假如还有第11天,这种预测方法可就不灵了。那位股票骗子要做的,只是选一批人,然后告诉一半的人股票会涨,告诉另一半人股票会跌。这样总能保证有人得到正确的预测结果。对于骗子来说,这件事情是100%发生的。但站在被推荐股票的人的视角,这个概率看起来似乎相当低。

假设有人做梦梦见自己中了彩票,不久后它真发生了。这件事发生在你我任何一个人身上的概率都很低。而站在上帝的视角,总会有人恰巧梦到即将发生的事,这个概率并不低。换句话说,一件怪事发生在你我身上,和发生在某个时间的某个人身上,两者的概率完全不同。