■ 文 | 财经麻辣姐 最懂财经图书的女出版人
正是“回归平均”现象,让人们误认为是惩罚有效而奖励无效,其实它和奖惩措施毫无关系。
在一部电影杀青之前对它的票房潜力进行预测,准确性和抛硬币猜正反面是差不多的。
华尔街在40年中出现一个“米勒奇迹”,其实是一个大概率事件;如果一直没有出现这么一个人,反而是很稀奇的事。
俗话说“不以成败论英雄”,理论上人人都同意这句话,一个人的能力不应该以一时的成败得失来判断。这好像表明,我们在看待一个结果时,是将随机性因素的影响考虑进去了的。真的是这样吗?其实,我们在现实中很容易犯这样的错误,把一次随机测量值当成了真实水平,并以此来制定相应的奖励或者惩罚措施。比如,孩子某次考试得了100分就会得到奖励,而某次考试不及格就会挨揍;销售人员在某年业绩特别突出就会得到提升,而某年业绩特别差就会被扣年终奖金;某个年轻球员某赛季表现特别突出就会被评为“年度新秀”,而某赛季成绩不好就只能坐冷板凳。问题是,这些奖励和惩罚措施真正有效吗?
有意思的是,我们会发现,一般而言惩罚措施比奖励措施更有效。也就是说,孩子拿到奖品之后的下一次考试不太可能再得100分,而不及格被胖揍一顿之后,下次考试多半会顺利过关。销售人员被提升之后,第二年的业绩很可能不太好,而被扣年终奖后的第二年销售业绩很可能有明显提升。体育界甚至有个专门的名词叫做“二年生症候群”,是指那些被评为“年度新秀”的球员们,在随后一个赛季中的表现大多不如人意。这是怎么回事呢?难道说人们天生就吃罚不吃赏?
对这个现象,一开始心理学家们百思不得其解,后来终于由诺贝尔奖得主、心理学家丹尼尔·卡尼曼解开了谜题。原来这种现象根本和赏罚效应无关,而和随机现象有关。一次考试分数、一年的销售业绩或者一个赛季的比赛成绩,其本质是一次随机测量数据,它们服从正态分布,偏离均值越远,出现的概率就越低。如果某次数据特别地好,或者特别地差,那么它很可能是远离均值的一次小概率事件,简单说就是超水平发挥或者发挥失常。那么在下一次测量时,就很有可能回归正常水平,这种现象在统计学上被称为“回归平均”。
正是“回归平均”现象,让人们误认为是惩罚有效而奖励无效,其实它和奖惩措施毫无关系。体育界普遍存在的“二年生症候群”,并不是得了“年度新秀”的球员们个个骄傲自满所以第二年发挥不好,而是他们本来就是因为超水平发挥而获得“年度新秀”,第二年表现平平就是典型的“回归平均”。
那接下来我们自然会问,如果一次两次结果不能说明什么问题,那么,那些薪水远超普通人的高收入群体,他们的业绩究竟在多大程度上可以归因于个人能力呢?有一本介绍随机性原理的书叫做《醉汉的脚步》,书中举了这样一个例子。
在好莱坞,电影公司主管们的平均年薪超过2500万美元。这些主管能否保住自己的饭碗,取决于他们能否每年从几千个剧本中,连续选出票房能大热的影片来。这并不容易。因为长久以来好莱坞一直面临一个非常尴尬的事实,那就是:没人能预测一部电影能否走红。名不见经传的小制作电影上映后红得发紫,或者阵容豪华、被寄予厚望的大制作电影遭遇滑铁卢,这在好莱坞已经见怪不怪。一位著名的电影监制就这样感叹:“如果我对所有被我毙掉的片子说‘行’,而对所有我通过的片子说‘不行’,最终的票房结果可能也差不多。”可以认为,在一部电影杀青之前对它的票房潜力进行预测,准确性和抛硬币猜正反面是差不多的。
问题是,在好莱坞的确有一些电影主管,似乎有慧眼识珠的能力,能在10年中有8年押中热门电影,这又怎么解释?这就要用到概率论的知识了。不妨把问题换一种说法:如果让10名好莱坞主管,每人扔10次硬币,你猜猜看,至少有一个人扔出8次以上正面或反面的可能性有多大呢?正确答案是2/3。换句话说,假定10名好莱坞主管的能力差不多,考察他们连续10年的业绩表现,那么,仅仅由于随机性,就会有66%的大概率,出现一名8年都走狗屎运的超级赢家,或者8年都发挥失常的超级输家。
这表明,在连续成功或者连续失败事件中,人们很容易低估随机性的影响力。在现实中,那个倒霉的超级输家必须卷铺盖走人,而那个幸运的超级赢家则会被视为能力卓越的典范。这种把“随机性重复”归因于优异能力的错误认知,学术界有个专门的术语叫“热手谬误”。除好莱坞之外,“热手谬误”的另一个重灾区是华尔街。华尔街总是每隔几年就会出现一个明星基金经理,在某个连续时间段中的业绩表现非常突出。
书里还举了这样一个例子:一名叫比尔·米勒的基金经理,在1991年至2006年的连续15年中,他的业绩表现都跑赢了标准普尔500指数。米勒被媒体誉为“1990年代最伟大的基金经理”。在评论米勒的表现时,观察家们指出:“在过去40年中,没有一只基金的表现,能连续12年优于市场。”并且他们肯定地说:“米勒仅凭运气就能做到这一点的可能性微乎其微。”然而,如果正确计算的话,出现“米勒奇迹”的真正概率,恐怕会让你大吃一惊。
被誉为“1990年代最伟大的基金经理”的比尔·米勒
一般人以为,如果米勒仅凭运气做到15年连胜,相当于他连续扔15次硬币,每次都是正面朝上,概率为2的15次方分之一,也就是1/32768。但是,这种算法仅仅适用于只有米勒一个人只扔15次硬币的情况,这与现实不符。现实情况是什么呢?目前华尔街有好几千名基金经理,为了方便计算,这里假定只有1000名。
现实情况是,这1000名基金经理每人每年都扔一次硬币,一共扔了40年。那么,这40年中出现某一个基金经理,连续15年扔到正面朝上的概率有多大?答案是将近75%。没想到吧?换句话说,华尔街在40年中出现一个“米勒奇迹”,其实是一个大概率事件;如果一直没有出现这么一个人,反而是很稀奇的事。
实际上,产生“热手谬误”的根本原因,是人们搞混淆了一个概念,就是认为随机性意味着平均分布。事实正好相反,随机性的典型模式是一簇一簇的不均匀数据。葡萄干面包里的葡萄就是随机分布的,有的地方特别多,有的地方一颗也没有。随机发生的“成功事件”就好像是这些葡萄,它们更有可能是成串出现,而不是均匀分布。
那么,有没有什么办法,可以消除“热手谬误”的影响呢?这就要说到随机性原理的一个重要定律——大数定律。大数定律是指,当测量样本量足够大时,样本均值就会越来越趋近于真值。大数定律也可以反过来理解,就是当测量样本量很小时,随机测量误差的影响就变得突出,这被称为“小数定律”。
换句话说,如果想要知道这些高收入人士的真实业务水平,那么仅仅只考察他们几年或者十几年的业绩是远远不够的,因为这时候运气会占很大比重。如果可以考察他们成百上千年的业绩,那么运气特别好的年头和运气特别差的年头就相互抵消了,业绩的均值才会非常接近于他们真实的业务水平。遗憾的是,这个办法在现实世界中显然做不到。不过我们至少可以提醒自己:当测量样本量很小时,要警惕热手谬误,“不以成败论英雄”。
思考题:你听《麻辣姐的书单》了吗?有什么意见和建议快来留言告诉麻辣姐吧!
▼阅读原文,把麻辣姐的书单抱走