声音简介
按理说,集体判断的噪声应该比个人判断小,因为毕竟你还可以取个平均值。我们专栏讲过科特·佩奇的《多样性红利》[1],我们知道只要群体中每个人能贡献自己独特的思考视角,每个人独立做判断,那么群体意见的平均值往往就是一个非常好的判断,可以称之为「群体智慧」。
然而关键就在于「独立性」是非常难以保证的。卡尼曼列举了很多研究,他本人还专门参与了集体判断的研究,他发现集体判断实在太容易出毛病了。
集体判断的质量高度依赖判断过程。人还是这拨人,用这个过程判断,就可能是三个臭皮匠顶个诸葛亮;用另一个过程,就可能是三人成虎、结果弄成了“羊群的共识”。咱们还是先讲个故事。
*
我们公司 CEO 的人选最终落在了两个候选人身上。一个是咱们第4讲说过的李志国,他的优点比较突出缺点也比较突出;另一个是徐一梅,她各方面素质都很好,履历完整,但是似乎缺少了一点特色。董事会开会做决定,规则是十个董事依次表态。孙总首先发言。
孙总说,我的选择是李志国。李志国的闯劲和能力有目共睹,是难得的领军人物。至于说他不善于搞关系,我们公司本来就不是一个喜欢搞关系的公司。
接下来轮到王总。王总其实没有很强烈的倾向,他根本就没下功夫研究两位候选人。但是王总特别信任孙总,现在既然孙总那么强烈地倾向李志国,王总就也表示选李志国。
第三个发言的是赵总,他心目中的人选,是徐一梅。但是现在孙总和王总都选的李志国,赵总就有点不敢说了。
并不是说赵总为人懦弱、很怕孙总和王总 —— 如果他掌握足够强烈的证据能说明徐一梅是更合适的人选,他会毫不犹豫地说出来。可问题是赵总觉得自己的论据并不是很强。他认为徐一梅也就比李志国好一点点 —— 可是现在孙总和王总那么坚决,也许他们有更充分的理由,他们做的调查研究应该比我深刻。
赵总隐藏了自己原本的观点,选择支持孙总和王总的判断。剩下的董事一看局面这么明显,也就都随大流了。
这个集体判断过程,发生了所谓「信息级联(informational cascades)」。开始的几个人直接影响了后面的人。后发言的人大大高估了前人判断的可信程度,在群体的压力下,更多地是在模仿别人,而不是做好自己的判断。
信息级联导致集体判断的偶然噪声。如果先发言的是赵总呢?可能结局会非常不一样。你参加这种会议如果想左右别的观点,“带节奏”,那就一定要争取先发言。但是不只是发言的顺序容易,像谁坐在谁的旁边,谁的表现更自信,谁有一个什么表情手势,都可能影响会议结果。
这种偶然噪声比你想象的可能严重得多。人们实在太容易被周围的人影响了。
*
有个著名的下载音乐的实验,我以前讲过。研究者搞了几十首歌曲,让上万个受试者随意选择下载。每首歌的下载量被实时显示,还有个排名。整个实验分成几个组独立进行。
结果发现,一首歌初期的下载量,能在很大程度上决定它此后的总下载量。人们就是更愿意下载那些已经被很多人下载过的歌曲 —— 哪怕最初的下载量是实验人员做过手脚的。当然特别好的歌曲总是能脱颖而出,特别差的歌曲你怎么捧都没用,但是总体而言,「人气」有个自我强化的机制。
还有个研究是给网上的评论投票。你可以投赞成或者反对票。研究者发现,如果收到的第一票是赞成票,那么第二票也是赞成票的可能性会提高 32%。而且哪怕五个月之后,最初的那个赞成票的总效果,也能让平均得分增加 25%。
还有,假设你在一个网络小组中发表了一个政治观点。如果第一个支持你的是民主党人,那么接下来就会有很多民主党人支持你。反过来说同样的观点,如果第一个支持你的是共和党人,那么接下来就会有很多民主党人反对你。
这还不是最严重的问题。最严重的问题叫「群体极化(group polarization)」。
*
群体极化是说,一群人坐在一起讨论事儿,可能会越说越激动,互相鼓励之下,做出一个非常极端的决定。
卡尼曼专门研究过陪审团的群体极化现象。比如现在有个案子,陪审团成员个个义愤填膺,都认为应该罚个惩罚性赔偿。研究者先让每个人写下他心目中打算罚多少钱。比如写出来数额排在中间的人认为应该罚 100 万,排第一的人要求的是罚 300 万。
如果就按照这些数字做决策,比如取个平均数,那么表决结果应该在 100 万左右,对吧?可是陪审团还没讨论完。
他们报出数字之后继续讨论。大家一看原来每个人都这么有正义感,看来我之前的判断有点保守了。于是每个人被其他人的情绪感染之下,大家等于是在互相鼓励。于是人们开始增加罚款数额。
研究者统计表明,这样讨论的结果,最终确定的罚款数额不但比之前排中间的那个数额高,而且有 27%的陪审团,最终数额比一开始报的最高数额还高。
这就叫「极化」。越说越激动,越讨论越极端。这也是一个普遍现象。可能一开始大家都觉得去法国开个分公司是个“不错的主意”,结果讨论之下,一看人人叫好,最后每个人认为这何止是不错的主意,简直是势在必行、是最了不起的策略!
讨论,有时候会加大噪声。
*
我读书读到这里,就想起了 1900 年大清向列强宣战的事情 [2]。你说按理说,慈禧虽然文化程度低,但也是执政多年,可以说有丰富的政治经验,她怎么就能做出这么荒唐的决策呢?现在看,这很可能就是一次群体极化。
最初,义和团在山东和直隶活动,中央政府并没有一个统一的态度。是 1900 年初,慈禧想要废掉光绪,重新建储,导致各方不满 —— 特别是洋人强烈反对,慈禧才迫切想要利用义和团对付洋人。但一开始慈禧也只是一个想法,一个愿望,并没有下决心。
慈禧派了两拨人去现场考察义和团,看看能不能用。一个是保守派强硬分子刚毅,他是绝对主张利用义和团灭洋;另一拨是比较理性的赵舒翘和何乃莹。特别赵舒翘,一开始就知道义和团是乌合之众,到现场看了一天就确定了根本没有战斗力。
但是赵舒翘没有据实上报。他考虑了慈禧的愿望,特别是刚毅的态度。不过他也没敢谎报,他搞了个文字游戏,很含糊地说我看见义和团有种种法术。
而慈禧这一听,就成了既然连赵舒翘都这么说,那就说明义和团真有东西。领导意图已经如此明显,再加上此时总理衙门完全被保守派占据,理性派就很难发声了。
于是义和团被允许进入北京。于是义和团开始打洋人。而既然打都打起来了,慈禧宣战就成了顺理成章的事情。其实即便到了这个时候,仍然有许景澄、袁昶、徐用仪、立山和联元五个大臣公开表示反对开战,可是他们都被慈禧处死了。最终义和团果然不堪一战,慈禧仓皇出逃,当初的主战派大部被清廷诛杀。
你看,慈禧的初心,可真不是要独断专行。她也想充分听取意见,她也尊重了集体决策……她的问题在于不讲「决策卫生」。
*
什么样的决策过程才算是讲卫生呢?卡尼曼举了一个例子,指纹比对。
指纹是非常有力的证据,但是你可能不知道,法医的指纹比对,也可能出错。一般警方在犯罪现场采集到指纹,指纹专家做判断要走一个分四步的程序。首先是「分析」,看看这个指纹的质量怎么样,有哪些突出的特征;然后是「比较」,跟数据库里的指纹作比对;然后是「评估」,作出判断,两个指纹到底是不是属于同一个人;最后还要「验证」,也就是再找一位专家,看看能不能得出同样的结论。
你想到了,第四步容易出问题。第二位专家如果听说了第一位专家的意见,他很可能会受到影响。特别是如果你听说第一位专家是个资深专家,你就不太愿意推翻他的看法。
但是信息级联也可以发生第一位专家身上。比如给你指纹的警察随口告诉你,“这个嫌疑人有不在场的证明”,或者“那把枪肯定是他的”,请问你会不会受影响?又或者你已经知道现场有目击证人,或者罪犯已经招供了,你会不会受影响?
你肯定会的。现场指纹有时候非常模糊,答案并不是显然的。如果你事先告诉一个专家这次鉴定的方向,这位专家关注到指纹中的细节就会更少 —— 他会陷入确认偏差,只采纳定向的证据。研究者做实验发现,指纹鉴定专家如果得到一个强有力的背景信息,有五分之四的可能性会改变自己的判断;另一个研究认为是六分之一,但是这个比率也不小。
这大概就是为什么,在美国 350 个后来翻案成功的案例中,有 45% 都是因为法医的判断错误导致的。
那么据此,决策研究者提出了三项建议。
第一,给判断者提供信息,必须严格按照一定的顺序进行,千万不能给早了。
比如你要让这位专家比对一个指纹,那你就把指纹给他 —— 别的什么都别说。他要做的唯一判断就是这个指纹是不是那个人的。至于说那个人是不是嫌疑人、有多少其他证据指向那个人,与指纹判断无关,他根本就不应该知道。
第二,专家应该详细记录自己每一步的判断,严格按照程序顺序进行。
比如第一步是分析指纹,这时候你先不要看要对比的那个指纹。你就把眼前这个指纹看清楚,它有哪些关键特征都写下来。完了再去作对比。这也就是把调研和决策分开。这样就能降低你“只看自己想看的”的风险。
第三,第二位专家做判断的时候,不应该知道第一个专家的判断结论。
这些建议显然对所有集体决策都有意义。
*
这一讲中决策卫生的关键就是信息披露的顺序。做判断并不是知道的越多越好 —— 不该你知道的你不知道,反而能做出更客观的判断。有些信息应该在判断做出之后再给,否则就有可能引发信息级联,导致偶然噪声。
有个著名的集体判断方法叫「德尔菲法(Delphi method)」,是把决策进行很多轮。每一轮中每个人独立判断,匿名提交判断结果,然后一起公开,大家充分列举自己的判断理由,然后再来下一轮匿名判断。
卡尼曼把这个方法简化成了「评估 — 讨论 — 再评估」三步。更具体的做法,咱们下一讲再说。
音频列表
- 2021-10
- 2021-10
- 2021-10
- 2021-10
- 2021-10
- 2021-10
- 2021-10
- 2021-10
- 2021-10
- 2021-10
查看更多
用户评论