今天我要来解读一本2021年九月份最新出版的重磅心理学新书《噪声:人类判断的缺陷》。这本书的第一作者是诺贝尔经济学奖得主,堪称我们心理学界半壁江山的著名行为经济学家丹尼尔·卡尼曼。卡尼曼老师的上一本书是十年前出版的《思考,快与慢》,出版十年来,好评无数,今天已经是一本心理学的必读书了。
本来以为那本书就已经总结了卡尼曼老师毕生的研究精华,但万万没有想到的是,十年后,近九十岁高龄的卡尼曼老师居然在现在这本新书里又提出和论证了一个全新的问题,一个他以前基本上没有涉及过的问题,那就是判断和决策里的噪声。因为噪声的存在,我们在很多场合都难以做出准确的判断和决策。那么,噪声是什么?它是怎么样产生的,又该如何避免?这就是卡尼曼在《噪声》这本新书里论证的问题。
我讲书一般来说是挑亮点,但这本《噪声》是有非常完整的知识体系的,所以我今天就打算在这期节目里把《噪声》这整本书的知识框架从头到尾给大家捋一遍。今天这期节目算是对《噪声》这本书的一份完整的导读。你将来带着这期节目的印象去读这本书的话,理解起来可能就会更加顺畅一些。《噪声》这本书写得非常硬核,它的理论细节和案例都相当丰富,所以如果大家以后有兴趣,有时间的话,还是应该找这本书来读一读。
那么,我对《噪声》的解读分成这样的五个部分:第一,什么是噪声,噪声的定义是什么?第二,噪声有哪几种类型?第三,噪声的放大器有哪些?第四,如何减小噪声?第五,减小噪声的措施会遇到哪些障碍?内容比较多,所以我做了一份思维导图,放在了节目的简介里。如果有需要的话,你可以去收藏。
好,那我们言归正传,来解读《噪声》这本书。首先是第一个问题,什么是噪声,噪声的定义是什么?我们用一个打靶的例子来做说明。请大家来看屏幕上的这张图。图上有四个靶子,分别是A、B、C、D,四个队伍打靶的结果。每个队伍有五个人,他们都用同一支步枪来打靶。A队的个个都是神枪手,每一枪都正中靶心,这是完美的队伍。B队每个人都是歪了,但歪得非常集中,非常整齐划一,他们全都射中靶子的左下角,我们把B队叫做偏差队。偏差就是像这样整齐划一的错误产生,这种整齐划一的错误原因也不难分析,最大的可能就是他们用的那支枪准星有问题。
C队也是每个人都歪了,但歪得非常五花八门,歪得很随机,他们的枪眼非常分散,几乎没有规律可循。C队就是噪声队。C队这种歪的五花八门的错误就是噪声。B队和C队这两种情况分别就代表了我们人类做判断时非常典型的两种错误。第一种错误是B队那样的偏差,偏差就是不同的人做判断时整齐划一地朝向同一个方向偏。那为什么会有这种整齐划一的错误呢?这是因为全人类其实都有一些相互共通的心理倾向,比如说,全人类都有对于负面信息比较神经过敏的倾向。
所以,比如说当我们在网络上读到一篇很危言耸听的文章时,我们就都会被诱发出恐惧心理,然后不约而同地做出一些非常类似的不理性的决定。人类做判断时的第二种错误就是C队那样的噪声,噪声其实就是飘忽,就是不一致。一个人这一次和下一次做出的决定会不一致,一群人在判断同一件事情时彼此之间意见可能也会不一致,这就是噪声。噪声可以说是无处不在的,比如说在面试时可能会有噪声,面试官之间的意见经常会分歧非常巨大,一个面试官可能要定了你,另外一个却说你未必适应公司文化就把你给踢了。
再比如说医生诊断疾病时也会有噪声,第一个医生说你得赶快住院动手术,另外一个医生却说你吃点药就可以了。预测股票走势时会有噪声,一半的机构说明天会涨,一半的机构说明天会跌,这也是家常便饭。再比如老师改卷子时也会有噪声,上午老师心情好,给的分数就比较偏高,下午他累了,打分就变严了。这也是噪声。噪声是非常普遍的,做判断时我们当然都希望自己是像A队那样的神枪手,但实际上我们既有可能会像B队那样有偏差,也可能会像C队那样有噪声,我们其实是很难命中靶心做出准确的判断的。而且偏差和噪声很多时候还会同时出现,那就是图上的D队那样的情况,他们整体上是一个方向偏,这是偏差在起作用,但每一枪之间却还都是很分散,这是噪声在起作用。
总之就是一句话,人类判断的错误等于偏差加上噪声。卡尼曼老师的上一本书《思考,快与慢》讲的其实就是B队的情况,讲的就是偏差。而这一本《噪声》讲的当然就是C队的情况了,所以有了《噪声》这本书,人类判断中的错误,这个问题才算是论证完整了。
那么下面我们就可以进入到第二个问题,噪声有哪几种类型呢?有三种:第一,水平噪声;第二,稳定的模式噪声;第三,情境噪声。我们现在说水平噪声,水平噪声就是人与人之间的差异,比如说刚子和大柱是两位法官,刚子铁面无私,非常严厉,大柱比较宽容。那么如果同一个罪犯落在刚子手里,他就会被判30年,落在大柱手里就只判五年,这当然就是一个非常大的噪音。刚子和大柱这两个人之间的判罚非常不一致,这就是水平噪声,人与人之间的差异。
第二种噪声叫做稳定的模式噪声,稳定的模式噪声其实就是个人的偏好。比如说刚子这位法官一般来说对罪犯都是比较严厉的,但他对白领一向有好感,所以对白领罪犯就会比较宽容。于是两个犯了差不多程度的罪行的人案子都归刚子来判,但只是因为其中有一个人是白领,他就被轻判了。个人的喜好会导致判断的不一致,这就是稳定的模式噪声。
那既然有稳定的模式噪声,自然就有不稳定的模式噪声。刚子喜欢白领,这是一种比较稳定的倾向,但也有一些倾向是不稳定的,是经常会变动的,比如说心情。刚子是一个夜猫子,他上午总是特别困,一困起来心情就会比较差。于是上午落在刚子手里的罪犯就会被判得比较重,到了下午,这个夜猫子刚子的精神好起来了,他的心情也跟着好转,下午的那些罪犯就会被判得比较轻。这就是不稳定的模式噪声,不稳定的模式噪声其实就是在不同的场合、不同的情境下产生的噪声,所以它也叫做情境噪声。这就是第三类噪声。
我们来归纳一下,刚子和大柱之间的分歧是水平噪声,刚子对白领和非白领之间的分歧是稳定的模式噪声,上午的刚子和下午的刚子之间的分歧是情境噪声。这就是噪声的三种类型。
这里还有一点要注意,那就是三种噪声不是有我就没有你的,它们是会同时出现的。比如说刚子可能会在心情非常不好的时候遇上一个白领罪犯,并且还跟大柱的判罚产生了分歧。好,三种噪声的类型我们都说完了,下面我们进入到第三个问题,噪声的放大器。个体之间的差异总是会存在的,每个人也总是会有特殊的偏好,人的状态也会随着情境起起伏伏,所以说噪声可以说是无处不在的,有判断的时候就有噪声,但更加雪上加霜的是,有那么一些因素还会增大噪声的幅度。书里没有给这些因素取一个统称,我觉得可以把它们叫做噪声的放大器。
常见的噪声放大器有这样的三种。第一种放大器叫做客观无知。客观无知就是做判断的人,真的没有办法知道一些必要的信息。什么情况下最容易出现客观无知呢?做预测的时候,预测未来的时候,明天的股票是涨还是跌,未来三年内国际局势会发生什么样的变化,未来十年房地产的走势如何,做这种预测的时候,噪声是非常非常大的。不同的股票经纪人、不同的政治评论家、不同的经济学家经常分歧巨大,甚至会做出完全相反的预测,但这也不能全怪他们能力不行,因为未来的事情是由现状和未来还没有发生的很多事情共同决定的,那些未来的事情不是今天就能够预测到的。这里面是有客观无知的,所以预测未来的时候就难免有瞎蒙的成分,不同的专家在不同的时候往不同的方向瞎蒙,噪声能不大吗?
预测未来的时候会遭遇到客观无知,这就是第一种噪声放大器。第二种噪声放大器叫做匹配问题。什么是匹配问题呢?我是一名业余影评人,那我就拿看电影来做个例子。你看完一部电影,要给电影做一个评价,一般来说你不会去写一篇很长的影评,把你的各种感受都详细写出来。大多数时候,你会打开豆瓣,来到那部电影的页面,然后给电影评一个一星到五星的星级。这时候你其实就是在做匹配了,你是把你对电影的主观感受跟这个一颗星到五颗星的这个等级来做一个匹配。我们把一到五颗星这种评分系统叫做量表。凡是用量表来做判断,就必然会涉及到匹配问题。那么匹配问题是怎么样放大噪声的呢?
第一,它首先会放大水平噪声,也就是人与人之间的分歧。比如说我不久前给《失控玩家》这部电影打了五星,我打五星的标准是惊不惊喜。我本来以为这是个瞎胡闹的片子,没想到出乎意料的精彩,很惊喜,于是我就给了五星,但五星的意义在别人眼里可能是完全不一样的。对于另外一个影迷来说,五星可能只能打给那种传世经典,所以就算那个影迷对《失控玩家》这部电影的主观感受其实跟我是差不多的,但他只能给这部电影打三颗星。对于他来说,三星就已经是非常高的分数了。我和他对于一到五颗星这个量表的理解是完全不一样的,于是我们的打分就会像刚子和大柱的分歧一样,产生了水平噪声。
第二,匹配问题还会放大情境噪声。比如说企业里做绩效考核时,领导要在零到一百分的量表上给下属打分,但把一个人的表现跟零到一百之间的数字做匹配,其实是非常困难的。所以领导的打分往往是很飘忽,今天给大柱打了八十分,明天你可能就给他打九十分。大柱的表现到底有多好,其实在领导的主观评价上并没有什么变化,可是一打成分数就很飘忽了,于是匹配问题就放大了情境噪声,也就是说在不同的场合里,人们对量表的理解也会发生飘忽变化。
好,匹配问题,这是第二种噪声放大器。第三种噪声放大器是群体的不良影响。我们平时会说三个臭皮匠顶个诸葛亮,群策群力好像能够提高决策的质量,但我们等会儿就会讲到,一个群体共同做判断和决策的时候,如果想要提高决策质量,其实是有非常苛刻的条件的。如果不满足那个条件的话,那群体其实反而会增大决策的噪声。三个臭皮匠很多时候还不如一个臭皮匠,那群体是怎么样放大噪声的呢?也有两种情况。
第一种情况是谁占了先机,谁就会占尽优势。书里提到过这样一个实验,科学家给志愿者提供一个歌单,让他们随机试听歌单里的歌曲。如果遇到那种特别喜欢的,还可以下载下来。最后根据歌曲被下载的次数,研究者就可以知道哪些歌是最热门的,是最受欢迎的。不过,研究者其实在这里面做了一点手脚,把歌单发给志愿者的时候,有些歌曲就已经显示被下载了很多次。志愿者们会以为这些歌曲是被之前参加实验的其他志愿者下载过的,但实际上这些所谓的热门歌曲是研究者随机指定的。没想到的是,实验结束之后,研究者发现一开始被随机指定成热门歌曲的那些歌,最后居然就真的成为热门歌曲,志愿者们真的就更多地下载了这些歌。也就是说,如果你在开头的时候占了一点优势,这个优势就会自动扩大。
这其实也就是那些流量明星们在网络上做控评的原理。一旦置顶的那几条评论是夸这个流量的,后来的人的观点就会被他影响。之所以会有这样的一个效应,是因为大多数歌曲有多好听其实都是有点模棱两可的,所以人们很容易被其他人的判断影响。一开始有人觉得这几首歌好听,其他人也就会觉得这首歌好听起来了,那这不就产生了很大的情境噪声吗?那下一次如果是另外一些歌曲因为一些偶然的原因占据了先机,那他们就变成了热门歌曲。
不过,这个实验还有一个很有趣的附带发现,那就是那些最好听和最难听的歌,是不受这个操作的影响的。最好听的歌就算一开始是零下载量,最后也还是会被大家发现,而最难听的那些,即便一开始霸榜,最后也会被大家嫌弃。所以像控评这样的操作,他们的作用也是有限的。如果你的水平实在是太拉垮,那翻车还是迟早的。
那跟刚才这个实验类似的,还有这样一种情况,比如说面试的时候,在面谈完每一个候选人之后,面试官会坐在一起讨论该在几个候选人里选择哪一个。面试官刚子特别喜欢小李子,他第一个发言。他说小李子有多好,有多好,有多好,说了一大通。接下来轮到大柱发言了,大柱本来对小李子并没有什么特别的好感,他一看刚子这么笃定,他就以为刚子一定是发现了小李子身上的一些特别的优势,于是他也就跟着附和了几句。他说,小李子的确是挺不错的。再接下来是铁蛋发言,铁蛋本来对小李子的印象并不好,但他也没有多充分的理由,现在他一看到刚子和大柱都很支持小李子,于是他也就不多说什么了。于是,可能本来并没有多优秀的小李子,最后就以绝对优势的全票非常诡异地通过了面试。
但实际上,这完全就是小李子偶然占据了先机的结果。如果在另外一场面试中是喜欢另外一个候选人小柜子的面试官铁蛋先发言,那可能就没有小李子什么事情了。所以你看,场合不一样,结果就会完全不一样,情境噪声就这样形成了。谁偶然占据了先机,随后就会扩大优势,左右群体里其他人的选择。这是群体会增大噪声的第一个原因。
群体增大噪声的第二个原因叫做群体极化。极化就是极端化。群体极化是这样的一种现象,一群本来对某一个问题有差不多看法的人,他们聚在一起讨论完这个问题之后,他们的观点往往就会变得非常极端化。本来喜欢的会变得更加喜欢,本来讨厌的会变得更加讨厌。这就是群体极化,把大家的观点给极端化了。
比如说一群粉丝整天聚在一起讨论他们粉的那个流量明星,结果本来这些人可能只是一般喜欢,但讨论完之后就都变成了脑残粉。你可能会说这好像不对吧,这难道不是把噪声给缩小了吗?因为大家都变得一样,极端了嘛,彼此之间更加一致了。但问题在于这个世界上有很多不同的群体,比如说另外有一群本来只是有点讨厌这个流量明星的人,这群人聚在一起讨论之后就对这个流量明星变得咬牙切齿了。于是粉丝和非粉丝之间的分歧就变得更大了。
所以从整体上来看的话,群体极化还是增加了噪声。总之,要么是因为占了先机,要么是因为群体极化,群体很多时候是会放大噪声的。好,那么客观无知、匹配问题、群体的不良影响,这就是常见的三种噪声放大器。
那么下面我们就可以进入到第四个问题了。如果噪声那么普遍的话,应该如何减小噪声呢?减小噪声的手段有哪些?我提炼了立夏梳理分散在各章里的内容,我觉得常见的手段有这样的四种:第一种手段是把决策的过程交给一个每一个个体都能够独立做判断的群体;第二种手段是用排序来取代匹配;第三种手段是把决策过程交给一个模型;第四种手段是把决策过程交给决策达人。我们一个一个来说。
第一种减小噪声的手段是把决策过程交给一个每一个个体都能够独立做判断的群体。这里的关键词是独立。我们刚才刚刚说完群体很多时候是会让决策的质量下降的,之所以会下降,其实关键就在于群体里每个人的判断不够独立。他们受到了别人的影响,对歌曲的判断受到一开始的下载量的影响,面试官的判断会受到其他面试官的影响。但一旦群体里的每个个体的判断是相互完全独立的,那局面就会发生180度的反转。很多个独立判断汇总起来的综合判断,通常都是会明显减小噪声的。三个独立的臭皮匠才真的是顶个诸葛亮呢。
我们举个例子,《噪声》这本书里提到,在司法领域,指纹的鉴别就非常容易受到群体的不良影响。我读到这部分内容时还挺诧异的。我本来以为指纹的鉴定就像很多电影里拍的那样,是把罪现场的指纹输到电脑里,然后电脑程序就自动开始比对,最后就自动筛选出一个匹配的嫌疑人,事情就完了。但是卡尼曼告诉我们,原来现实情况完全不是这样的。因为犯罪现场采集到的那些指纹,一般来说质量都非常差,要么就是不完整,要么就是很模糊。所以比对指纹很大程度上是人工来完成的,靠的是那些鉴定专家的经验和主观判断。
这样一来,指纹鉴定就非常容易出现刚才的面试官开会的那种场面。鉴定专家刚子把犯罪现场收集到的一枚指纹跟嫌疑犯小柜子的指纹做了一番对照,认定这枚指纹就是小柜子的。办案刑警不太放心这个结果,于是就拿着刚子的鉴定报告给另外一位鉴定专家大柱看。他说,大柱,这是刚子的鉴定报告,你给再过目一下。结果呢,大柱鉴定完之后也说,这就是小柜子的指纹,但实际上这不是大柱和刚子真的达成了共识,因为大柱已经知道了刚子的结论,他大概率就会同意刚子的判断。大柱做的其实不是独立的判断。
但是这样的一种有缺陷的鉴定程序,居然就是过去很长时间里美国的司法鉴定中采用的一个标准程序。后面的每个鉴定专家都是拿到前面专家的鉴定结果之后再做鉴定的。结果这就造成了很多的冤假错案。因为这样的一种鉴定,实际上就是第一位鉴定专家的一言堂。那么,怎么样去避免这样一种错误呢?其实也很简单,那就是把指纹同时交给不同的鉴定专家,由专家们独立做判断。十位专家去独立的鉴定指纹,如果其中的大多数,比如说有七位,都说这枚指纹是小柜子的,那刑警才有理由高度怀疑小柜子就是罪犯。
独立做判断,然后汇总独立判断的结果。这个原理其实可以应用在各种做决策的场合,比如说做预测的时候,可以采用一种叫做德尔菲法的程序。德尔菲法是这样的,比如说如果你要让一群专家来预测未来的经济趋势,那么你可以让专家首先各自预测,然后把他们对经济数据的预测结果汇总之后做一个平均,再把平均结果反馈给每一位专家,让他们在这个基础上修改他们的预测。这样反复来几轮,也就是说专家可以得到其他专家预测的统计资料,但他们不能与其他专家去讨论。用这种方法做出的平均预测,会比专家们聚在一起自由讨论要准得多。这种程序的核心其实就是独立做判断,把决策过程交给每一个个体可以独立做判断的群体,这就是减少噪声的第一种手段。
那么减小噪声的第二种手段是用排序来取代匹配。我们刚才说的独立判断是针对群体的不良影响的一种对策,而用排序来取代匹配是针对前面说的另一种噪声放大器匹配问题的对策。我们刚才说过,如果领导要用零到一百分的分数来匹配下属的表现,这种匹配是非常困难的,它的标准往往是很飘忽的。那么,怎么去降低这种操作的难度呢?方法是这样的,先把下属做一个更简单的分级,比如说你可以先把每一个下属分进优、良、中、差、极差这五档,这比直接给个百分之的分数难度就小多了。然后在每一档里,给下属排序。小李子、小柜子都在优这一档里,是81分到一百分的档次,小李子如果比小柜子表现得更好,那么小李子就排在前面。用这样的方法做完整个排序之后,依次根据排序来打分。
这种操作的原理是我们做两两比较的时候往往能够判断得更加准确。你很难说清楚小李子和小柜子的工作表现各值多少分,但你比较容易能够分清楚小李子和小柜子谁的表现更好一点。所以呢,用排序来取代匹配是可以减小噪声的。
刚才说的这两种手段都是有针对性的,下面这两种就是通用型的手段了。第三种减小噪声的手段是把决策过程交给一个模型。所谓的模型就是公式、规则或者算法。比如说面试的时候,不是根据面试官的主观判断来决定录取,而是根据一个公式来做决定。比如说,把求职者的责任心、工作能力、团队合作能力这几个分数加起来求一个总分,总分高的那个录取。再比如说,做经济预测的时候,也不是找来一群经济学家,而是把当前的各种经济数据输入到一个人工智能的算法里,用算法给出经济预测的数据。高考其实也是一种模型,它就是用考试这个模型来代替人来挑选学生。人类的判断之所以有各种噪声,说白了就是因为人太灵活、太多变了。而模型非常死板,所以模型是没有噪声的。因为模型本质上其实都是固定的数学公式,只要每次的输入是一样的,它就能保证输出是一模一样的。在减小噪声这一点上,模型相比于人类是有碾压式的优势的。
所以,如果只从减小噪声这一点出发,人类就应该尽可能地把判断交给模型。哪怕有时候人类没有办法彻底退出,也应该尽可能地让模型先上,自己要尽可能地晚一点介入,应该遵守一个先模型后人类这样的原则。比如说谷歌公司在招募员工的时候,就这么干。谷歌面试求职者的时候,会分成两大环节。第一个环节是要让那些求职者参与一系列完全标准化的考核和面试。这里边的每项考核都独立打分、独立评估,而且每一项考核的细节也都是固定的,连面试时可以提哪些问题都有严格的规定。然后再把这些完全标准化的考核结果汇总起来,生成一份求职者档案。这份档案其实就是用一个完全死板的面试模型来产生的。
但谷歌公司也并不是完全排除人的判断。因为在接下来的第二个环节里,这份档案就会交给一个招聘委员会,委员会的这些人类成员读完档案之后,给出最后的雇佣意见。所以你看,谷歌的这一套招聘流程,并没有排除人类的那些微妙的直觉和判断,但他们是尽可能地把人类的介入延后,先让模型来判断,最后才交给人类。
关于模型的判断,我们这里还必须要强调一点,那就是用模型来做判断和决策的话,确实是没有噪声了,但这并不代表模型的判断就更准确。别忘了,判断的错误是等于偏差加噪声。模型很多时候其实只是把那张打靶图上的B队变成了C队,噪声的确是没有了,但偏差可能还在。枪还是整齐划一的,打偏了。所以并不是说把决策交给模型就万事大吉了。人类有责任不断优化模型,让模型的判断尽可能从B队往A队靠拢。
那么下面就是第四种减小噪声的手段,那就是把决策过程交给决策达人。减小噪声的最后这个手段非常简单粗暴,那就是找出那张打靶图上A队的那些神枪手,找出那些几乎枪枪都能够命中靶心的决策达人,把决策交给他们去做,那噪声问题不就被解决了吗?那么怎么样找到这样的一些决策达人呢?决策达人一般都有这么样三个显著的特点。
第一个特点是他们很有可能是某个领域里的专家。顶尖律师事务所里的律师、顶尖医院里的医生,做判断的准确率是要远高于这个行业里的普通人。我们可以优先信任他们的判断,但千万要注意,专家其实有两种:真正的专家和荣誉专家。律师、医生这些专家一般来说是真正的专家,因为他们的地位通常是靠真实的成绩换来的。名律师之所以是名律师,是因为他打官司真的能赢;名医之所以是名医,是因为他的医术真的很高。他们过去的成绩是可以客观验证的,这种专家的判断才值得信任。
但是还有另外一种专家,他们叫做荣誉专家。荣誉专家就是那种成绩不太容易去验证的专家,比如说有一些管理咨询顾问,有一些政治分析家,他们的成绩就很难用客观的标准去验证。比如就拿管理咨询顾问来说,一个公司好起来了,那是管理咨询顾问的功劳;如果被这家公司倒闭了,那就是其他的客观原因,总之没有这个顾问的错。像这样的一些专家,他们的地位是靠客户、靠同行对他们的尊敬建立起来的,说白了就是有点虚。这种荣誉专家的判断其实并不比普通人好,他们做出的判断,你就得留个心眼了。
那么,除了专家身份,决策达人的第二个显著特点是他们一般都是聪明人。几乎在所有领域,智力都与更加出色的表现有关。智力高的那些人,也更加有可能做出良好的判断。所以如果我们必须在两个意见之间做选择,又没有其他的参考信息的话,那我们就应该优先信任比较聪明的那个人。
决策达人的第三个显著特点是他们的心态往往都非常开放。智力只是事情的一方面,思考方式也非常重要。有些聪明人非常刚愎自用,他们坚信自己一开始的判断就是对的,这种人的判断力通常其实也不怎么样。真正厉害的是那些心态非常开放的人,这种人不但聪明,而且还非常谦虚和务实。他们不介意别人提相反的意见,他们甚至会主动去寻找那些可能与自己原来的观点相矛盾的新信息。他们不排斥把新信息与自己目前的观点进行整合,甚至非常渴望自己的想法为这些新信息改变。那这种心态开放的人做出的判断往往是比较准确的。
所以,如果我们要在两个聪明人的建议里面做选择,那就优先选择那个心态更加开放的人。总之,听专家的、听聪明人的、听心态开放的人,这就是减少噪声的第四种手段。
说了这么多,我们已经知道了噪声非常普遍,也知道了很多减小噪声的手段。那么接下来各行各业立刻行动起来,用这样的一些手段来尽可能减小噪声,那不就完事了吗?但实际上,减小噪声的这些手段是会遭遇到非常多的阻力的,于是我们就有了最后的第五个问题,那就是减小噪声的这些措施会遇到哪些障碍。
第一个障碍是人们不信任算法。我们刚才说过,把决策交给模型是能够非常显著地减少噪声的。而现在发展的最红火的模型当然就是算法,尤其是那些基于深度神经网络的人工智能算法。可麻烦的是,人们普遍是不太信任这种算法的,而人类其实有一种非常微妙的心态,那就是我们往往都期待算法应该是完美的,犯错是人类的特权,机器是不能够犯错的。比如说我们有时候听到人类司机开车出事,我们可能还会觉得情有可原,但自动驾驶必须是零事故,否则它就是不可信的。那么既然不信任算法,当然很多人也就会抵制通过算法来减少噪声的那些措施。
减小噪声的措施会遇到的第二个障碍是人们担心模型会扼杀积极性和创造力。如果决策过程全部交给非常死板的模型的话,人们会不会感觉自己就像是机器里的一个齿轮,毫无主观能动性可言?如果一个公司里所有的决策都由模型来完成,那这个公司里的员工是不是都会感觉自己啥也决定不了?他们的士气会不会受到很大的打击?以及还有,人类的决策虽然不定,但这个飘忽不定也会诞生很多创意。如果决策过程都交给死板的模型的话,那会不会扼杀人类的创意呢?这些疑问里其实都关乎一个大问题,那就是到底哪些场合里才需要减少噪声?
我们当然希望医生在诊断一个人是不是有高血压的时候不要有什么创意,不要有什么主观能动性,这种场合里噪声就应该越小越好。但在一家公司里,如果想要让员工更加快乐、更加有灵感,那是不是就应该容许有一些噪声存在呢?或者说是不是可以学习谷歌那样的招聘法,一方面把创意的流程标准化,大框架上按照模型的步骤来做,但在另外一方面,在每一个步骤里,又可以给人很大的灵活性,发挥人的创造性?这样的措施是不是可行呢?总之,减小噪声的场合有哪些,以及如何在减小噪声的同时又不打击人们的积极性和创造力,这都是一些很值得思考的问题。
刚才说的这两个障碍其实都是针对于模型的。那么最后,这个障碍才是非常普遍的问题。减小噪声的最后一个障碍就是成本。减小噪声当然是好的,但性价比怎么样?性价比足够高吗?那比如说有一个老师来批改所有的卷子的话,那一定是有考生的,最适合的解决方案就是让五个老师分别独立改卷子,然后取平均分,但谁来给这些多出来的工作量埋单呢?就算有人埋单,这样的付出又值不值得,怎么样去衡量?这里边的性价比也是非常值得进一步思考和研究的问题。
虽然卡尼曼在书里反复强调减少噪声的这些措施都是必须的,因为噪声造成了非常多的不公平,但我个人读完这一部分内容之后,感觉关于算法如何博取人类的信任,以及关于怎么样衡量减少噪声的性价比,这样的一些问题,其实在现阶段还都比较缺乏深入的研究。这一部分内容相比于前面那些内容还是比较开放的,这里边还有很多值得深入的思考和探讨的细节。
好,那么到这儿,《噪声:人类判断的缺陷》这本书的知识框架我们就梳理完了。我们讲了噪声的定义、类型,讲了噪声的放大器,以及减小噪声的一些措施和障碍。关于这些问题,如果你有任何的思考和疑问,都可以通过评论或者弹幕告诉我。
热门跟贴