小样本偏见

从小样本中“总结”出错误的规律和结论,是广大投资者最容易犯的错误之一。

有一天,我在检查儿子的家庭作业时,看到了这样一道题目,如图1-4所示。

图1-4 小学生智商测试题

这是一道给小学生做的智商测试题,要求小朋友根据题目中已知的模式,推导出下一个图形的颜色和形状(正确答案为空心白色圆形)。

像这种找规律的题目,在小学生智商测试题和数学考试中非常多见。这样的题目也被称为“模式识别”题。如果一个孩子可以在规定的时间内做对更多的类似题目,那么他的得分就会较高,也会被认为智商更高。

从任何排列组合中找规律,是人类天生的一种本能。英国著名作家克里斯·希金斯(Chris Hitchens)说过:人类天生喜欢找规律。对于我们来说,有一个坏的理论或者阴谋论,都要比没有理论好。

问题在于,我们生活的现实世界,其纷繁复杂的程度要远高于上面智商测试题中的那几个方块和圆圈。很多时候,真实世界根本没有规律,或者其规律远远无法用一两个简单的“模式”解释。在这种情况下,如果还顺着从小养成的“找规律”的习惯去认识和解释世界,就可能犯下非常明显的错误。

在纳西姆·尼古拉斯·塔勒布的畅销书《黑天鹅》(The Black Swan)中,作者提到过一个非常有趣的“火鸡的故事”。[2]

一开始火鸡在鸡棚里的时候,每天早上农夫都会带着一碗玉米来喂它。假以时日,火鸡对此形成了习惯,每天早上听到农夫走近鸡棚的声音,它就知道开饭的时间到了。因此渐渐地,火鸡总结出一个规律:只要农夫走近,就是自己吃大餐的时候,这时也是它一天中最快乐的时候。

到了感恩节那天,农夫像往常一样走近鸡棚,火鸡像往常一样欢呼雀跃。但是火鸡没有想到的是,农夫手里拿的不是玉米,而是一把刀。因为感恩节到了,农夫要过来杀鸡。可怜的火鸡,死到临头可能也没有明白,为什么自己总结出的“农夫来,有米吃”这样的规律不灵了。

火鸡之所以会总结出错误的结论,原因在于:强行从本没有规律的事件中寻找规律,或者基于非常小的样本去总结规律。在现实生活中,受“小样本偏见”影响,做出非理性行为的例子不胜枚举。

在新加坡或者中国澳门的赌场,会有这样一个有趣的现象:赌场里有不少老太太,几乎每人都拿着一张纸和一支笔,在轮盘边上不停地记。她们记的是每次轮盘转下来的结果——红色或者黑色。如果遇到连续多次是一种颜色(比如连续5次都是红色),那么老太太就会果断出手,在下一把押上重注赌另一种颜色(比如黑色)。

学过一些基础统计学的朋友都知道,每一次轮盘开转都是独立事件。也就是说,上一次小球停留的位置(红色或者黑色),和下一次小球停留的位置之间没有任何关联。每一次小球停在红色或黑色的位置,都属于随机事件。

那么,为什么这些老太太如此热衷于用“记账法”帮助自己下注呢?她们的思路大约是这样的:赌场里的轮盘红色和黑色格子五五开,因此从概率上讲,小球掉入红色格子和黑色格子的概率各为50%。按照这个逻辑,如果在同一个时间段内,小球连续多次停留在同一种颜色的格子里(比如黑色),那么根据“概率回归”原则,接下来小球则更有可能停留在另一种颜色的格子里(比如红色)。

心理学将这种错误叫作赌徒谬误,其错误的根源在于“小数法则”。从理论上讲,如果轮盘连续转1亿次(大数),那么小球最终停留在黑色和红色格子里的分布确实非常接近50/50。但是,如果轮盘只转几十次或者几百次(小数),在如此小的样本量里,什么样的分布(比如连续20次黑色,或者连续20次红色)都有可能发生。

很多读者看到这里,可能会觉得那些在赌场里做笔记的老太太愚不可及。但是事实上,在我们的日常生活中,受到赌徒谬误影响的例子比比皆是。很多情况下,我们的智慧程度并不比这些老太太高多少。在这里和大家分享一个非常有趣的“猜硬币”实验[3]

在这个实验中,参赛者被告知他们每次扔的硬币是一枚被做过手脚的特殊硬币。这枚特殊硬币出现正面的概率是60%,出现反面的概率是40%。

每位参赛者有半小时的时间参加猜硬币大赛。每次猜对,就会有25美元的奖励。如果猜错,参赛者的奖金就会被扣除。因此,这是一场真金白银的“赌博”游戏。

按理来说,要想在半小时内赢取最多的奖金,参与者只需坚持一个非常简单的策略,即每次都猜正面即可。因为参赛者一开始就被告知硬币出现正面的概率为60%。当一个老老实实的“笨蛋”,只要每次都坚持猜正面,就能保证获得最大的“投资回报”。

但十分有趣的是,研究人员发现,每当硬币连续出现几个正面以后,就有很多参赛者会在下一轮选择猜反面。每个参赛者都知道,硬币出现正面的概率远高于反面(高出20%)。但是他们还是会不由自主地选择押反面,这也导致了这些参赛者最后的“投资回报”不尽如人意。

即使在信息完全透明的前提下,很多“聪明人”还是会选择做出违背统计概率的投资决定,这正是行为偏见的可怕之处——明知山有虎,偏向虎山行。在下意识和统计概率之间,人类往往会倾向于通过“下意识”做出决策,而这也是我们经常犯“愚蠢错误”的主要原因之一。

接下来,再和大家分享一个非常有趣的实验。这个实验来自1974年《科学》(Science)杂志上一篇影响力深远的学术论文[4]

如图1-5所示,假设有两个盒子,盒子A和盒子B。现在已知:盒子A里大约有2/3的红球和1/3的球;而盒子B恰恰相反,里面有2/3的球和1/3的红球。也就是说,盒子A里的红球更多,盒子B里的球更多。

图1-5 盒子A和盒子B中的小球分布

现在,我们分别从两个盒子中随机抽取小球,并根据所抽到的小球判断该盒子是A还是B。

我们从盒子1中取了5个小球,其中有4个是红球,因此抽到红球的概率为80%;从盒子2中我们随机取了30个小球,其中有20个小球的颜色是红的,因此抽到红球的概率为67%,如表1-2所示。

表1-2 不同盒子抽到红球的概率

现在让我们来猜一下:哪个是盒子A?

如果像大多数人那样,那么你会猜盒子1是盒子A。原因很简单:从第一个盒子中抽到的红球更多,概率为80%,而盒子A中的红球占大多数,因此,盒子1是盒子A,盒子2是盒子B。

但正确的答案是:盒子2中有更多红球的可能性更大,因此盒子2更有可能是盒子A。

这就涉及统计学里的一个基本概念:样本量。由于我们从盒子2中抽取的样本量(30个球)更大,其统计结果的显著性更强,因此也更有代表性。

参与市场的投资者如果不多加注意,也很容易堕入“小样本偏见”的陷阱。

举例来说,2000—2009年发展中国家的股票市场表现非常好,每年的平均回报率大约为10%。相对而言,发达国家的股票市场回报率很差,每年还不到1%,如图1-6所示。

在那10年里,新闻媒体关于“金砖四国”强势崛起,将对发达国家发起强有力挑战的报道铺天盖地,这些报道令广大发展中国家的国民和投资者兴奋不已。

但如果投资者只根据这些新闻和大众情绪规划自己的投资决策,2009年把资金都投到发展中国家,那么在接下来的几年中,投资者的回报会受到非常严重的打击。

数据来源:彭博新闻社(Bloomberg News,后文简称彭博社)

图1-6 发达国家和发展中国家股票市场年平均回报率(2000—2009年)

图1-7对比了从2010年1月1日到2019年12月31日,发展中国家股市回报率(MSCI[5]发展中国家股市ETF[6])和美国股市回报率(标准普尔500指数ETF)的对比(美元计)。我们可以看到,标准普尔500指数的回报率平均每年上涨11%,而同期MSCI发展中国家股市ETF的回报率每年上涨不到1%。

我所举的盒子猜小球和不同时间世界股市回报率这两个例子之间有什么相关的地方呢?我们可以从这个角度来思考,如表1-3所示。

表1-3 盒子与股市平均回报率

数据来源:彭博社

图1-7 2010—2019年发展中国家股市与美国股市回报率对比

上文提到,我们从盒子1中取出了5个小球,样本量偏小。这就好像我们回顾了2000—2009年的股票市场回报率,并得出发展中国家股票市场回报率更好的错误结论。

而如果拉长时间维度,检查更多的历史样本,比如过去100多年,如图1-8所示,我们就会发现,发达国家的股市回报率要比发展中国家的股市回报率更高,平均每年有1%左右的超额回报率。有了更多历史数据和样本的分析,就好像上文中的盒子2(取了30个小球),从统计角度来看,其结果的显著性更强。

说了那么多,其实我想和大家分享的是,由于人类天生的认知缺陷,加上从小开始的智商训练,我们习惯于从一些小样本中总结普遍规律。而由这种认知偏见总结出的规律和结论,自然不可靠。

一个聪明的投资者应该认识到自己可能存在的偏见和弱点,并时刻提醒自己不要堕入类似的思维陷阱。

数据来源:E.迪姆森,P.马什,M.斯汤腾.投资收益百年史[M].戴任翔,叶康涛,译.北京:中国财政经济出版社,2005.

图1-8 发展中国家和发达国家股票市场年平均回报率(1900—2013年)