小样本偏见
从小样本中“总结”出错误的规律和结论,是广大投资者最容易犯的错误之一。
有一天,我在检查儿子的家庭作业时,看到了这样一道题目,如图1-4所示。
图1-4 小学生智商测试题
这是一道给小学生做的智商测试题,要求小朋友根据题目中已知的模式,推导出下一个图形的颜色和形状(正确答案为空心白色圆形)。
像这种找规律的题目,在小学生智商测试题和数学考试中非常多见。这样的题目也被称为“模式识别”题。如果一个孩子可以在规定的时间内做对更多的类似题目,那么他的得分就会较高,也会被认为智商更高。
从任何排列组合中找规律,是人类天生的一种本能。英国著名作家克里斯·希金斯(Chris Hitchens)说过:人类天生喜欢找规律。对于我们来说,有一个坏的理论或者阴谋论,都要比没有理论好。
问题在于,我们生活的现实世界,其纷繁复杂的程度要远高于上面智商测试题中的那几个方块和圆圈。很多时候,真实世界根本没有规律,或者其规律远远无法用一两个简单的“模式”解释。在这种情况下,如果还顺着从小养成的“找规律”的习惯去认识和解释世界,就可能犯下非常明显的错误。
在纳西姆·尼古拉斯·塔勒布的畅销书《黑天鹅》(The Black Swan)中,作者提到过一个非常有趣的“火鸡的故事”。[2]
火鸡之所以会总结出错误的结论,原因在于:强行从本没有规律的事件中寻找规律,或者基于非常小的样本去总结规律。在现实生活中,受“小样本偏见”影响,做出非理性行为的例子不胜枚举。
在新加坡或者中国澳门的赌场,会有这样一个有趣的现象:赌场里有不少老太太,几乎每人都拿着一张纸和一支笔,在轮盘边上不停地记。她们记的是每次轮盘转下来的结果——红色或者黑色。如果遇到连续多次是一种颜色(比如连续5次都是红色),那么老太太就会果断出手,在下一把押上重注赌另一种颜色(比如黑色)。
学过一些基础统计学的朋友都知道,每一次轮盘开转都是独立事件。也就是说,上一次小球停留的位置(红色或者黑色),和下一次小球停留的位置之间没有任何关联。每一次小球停在红色或黑色的位置,都属于随机事件。
那么,为什么这些老太太如此热衷于用“记账法”帮助自己下注呢?她们的思路大约是这样的:赌场里的轮盘红色和黑色格子五五开,因此从概率上讲,小球掉入红色格子和黑色格子的概率各为50%。按照这个逻辑,如果在同一个时间段内,小球连续多次停留在同一种颜色的格子里(比如黑色),那么根据“概率回归”原则,接下来小球则更有可能停留在另一种颜色的格子里(比如红色)。
心理学将这种错误叫作赌徒谬误,其错误的根源在于“小数法则”。从理论上讲,如果轮盘连续转1亿次(大数),那么小球最终停留在黑色和红色格子里的分布确实非常接近50/50。但是,如果轮盘只转几十次或者几百次(小数),在如此小的样本量里,什么样的分布(比如连续20次黑色,或者连续20次红色)都有可能发生。
很多读者看到这里,可能会觉得那些在赌场里做笔记的老太太愚不可及。但是事实上,在我们的日常生活中,受到赌徒谬误影响的例子比比皆是。很多情况下,我们的智慧程度并不比这些老太太高多少。在这里和大家分享一个非常有趣的“猜硬币”实验[3]。
即使在信息完全透明的前提下,很多“聪明人”还是会选择做出违背统计概率的投资决定,这正是行为偏见的可怕之处——明知山有虎,偏向虎山行。在下意识和统计概率之间,人类往往会倾向于通过“下意识”做出决策,而这也是我们经常犯“愚蠢错误”的主要原因之一。
接下来,再和大家分享一个非常有趣的实验。这个实验来自1974年《科学》(Science)杂志上一篇影响力深远的学术论文[4]。
图1-5 盒子A和盒子B中的小球分布
表1-2 不同盒子抽到红球的概率
但正确的答案是:盒子2中有更多红球的可能性更大,因此盒子2更有可能是盒子A。
这就涉及统计学里的一个基本概念:样本量。由于我们从盒子2中抽取的样本量(30个球)更大,其统计结果的显著性更强,因此也更有代表性。
参与市场的投资者如果不多加注意,也很容易堕入“小样本偏见”的陷阱。
举例来说,2000—2009年发展中国家的股票市场表现非常好,每年的平均回报率大约为10%。相对而言,发达国家的股票市场回报率很差,每年还不到1%,如图1-6所示。
在那10年里,新闻媒体关于“金砖四国”强势崛起,将对发达国家发起强有力挑战的报道铺天盖地,这些报道令广大发展中国家的国民和投资者兴奋不已。
但如果投资者只根据这些新闻和大众情绪规划自己的投资决策,2009年把资金都投到发展中国家,那么在接下来的几年中,投资者的回报会受到非常严重的打击。
图1-6 发达国家和发展中国家股票市场年平均回报率(2000—2009年)
图1-7对比了从2010年1月1日到2019年12月31日,发展中国家股市回报率(MSCI[5]发展中国家股市ETF[6])和美国股市回报率(标准普尔500指数ETF)的对比(美元计)。我们可以看到,标准普尔500指数的回报率平均每年上涨11%,而同期MSCI发展中国家股市ETF的回报率每年上涨不到1%。
我所举的盒子猜小球和不同时间世界股市回报率这两个例子之间有什么相关的地方呢?我们可以从这个角度来思考,如表1-3所示。
表1-3 盒子与股市平均回报率
图1-7 2010—2019年发展中国家股市与美国股市回报率对比
上文提到,我们从盒子1中取出了5个小球,样本量偏小。这就好像我们回顾了2000—2009年的股票市场回报率,并得出发展中国家股票市场回报率更好的错误结论。
而如果拉长时间维度,检查更多的历史样本,比如过去100多年,如图1-8所示,我们就会发现,发达国家的股市回报率要比发展中国家的股市回报率更高,平均每年有1%左右的超额回报率。有了更多历史数据和样本的分析,就好像上文中的盒子2(取了30个小球),从统计角度来看,其结果的显著性更强。
说了那么多,其实我想和大家分享的是,由于人类天生的认知缺陷,加上从小开始的智商训练,我们习惯于从一些小样本中总结普遍规律。而由这种认知偏见总结出的规律和结论,自然不可靠。
一个聪明的投资者应该认识到自己可能存在的偏见和弱点,并时刻提醒自己不要堕入类似的思维陷阱。
图1-8 发展中国家和发达国家股票市场年平均回报率(1900—2013年)