概率思維是科學(xué)研究概念領(lǐng)域的一大進(jìn)步,置信水平視為概率思維的典型代表。然而,我們也會(huì)看到,極度自信的科學(xué)家也未能認(rèn)識(shí)到不確定性的罕見(jiàn)例外。2020年7月,美國(guó)一位德高望重的科學(xué)家在推特上發(fā)文稱(chēng):“美國(guó)的新冠疫情將在4周內(nèi)結(jié)束,官方通報(bào)的總死亡人數(shù)(援引原文)將低于17萬(wàn)?!笔潞罂磥?lái),我們可以說(shuō)這是一個(gè)錯(cuò)誤的預(yù)測(cè),而且錯(cuò)得相當(dāng)離譜。因?yàn)榻刂帘緯?shū)撰寫(xiě)之時(shí),新冠病毒仍在美國(guó)肆虐并已經(jīng)奪走100多萬(wàn)人的性命。得益于“后見(jiàn)之明”,我們通常能抓住一些專(zhuān)家的“錯(cuò)處”,但我們之所以提到這個(gè)特殊的例子,不是因?yàn)檫@位專(zhuān)家給出了錯(cuò)誤的論斷,因?yàn)樵诋?dāng)時(shí)前景未明的情況下,確實(shí)存在合理的證據(jù)讓他認(rèn)為疫情可能會(huì)在短期內(nèi)終結(jié)。我們之所以在此提及這一案例,是因?yàn)樵谒恼摂嗬锿耆珱](méi)有關(guān)于置信度的表述(例如:“我有80%的把握認(rèn)為……”),他甚至沒(méi)有提供一丁點(diǎn)兒的暗示來(lái)表明,他關(guān)于新冠疫情的論斷有可能是不全面的或是錯(cuò)誤的。
值得注意的是,在這個(gè)案例中,該專(zhuān)家發(fā)表的意見(jiàn)首先超出了他自己的專(zhuān)業(yè)領(lǐng)域,其次他是在社交媒體上發(fā)表的見(jiàn)解。我們猜測(cè)(至少有75%的把握認(rèn)為),如果他是以傳染病或公共衛(wèi)生為主題,撰寫(xiě)一篇即將刊登在專(zhuān)業(yè)期刊上并接受其他專(zhuān)家評(píng)閱的文章,那么他在闡述自己的觀點(diǎn)時(shí)或許會(huì)謹(jǐn)慎得多。因?yàn)閷?zhuān)業(yè)期刊的編輯和審稿人會(huì)把不夠嚴(yán)謹(jǐn)?shù)母遄油嘶貋?lái),要求他在一定置信水平的基礎(chǔ)上重新闡述其觀點(diǎn)?,F(xiàn)在,我們很想給這位科學(xué)家找個(gè)臺(tái)階下,并幫其開(kāi)脫道:“沒(méi)關(guān)系,他不過(guò)就是閑來(lái)順手發(fā)了這么一條推文,全世界都知道每個(gè)人都可以在推特上隨心所欲地發(fā)表觀點(diǎn)?!钡?qǐng)你捫心自問(wèn):世界上有多少人會(huì)從一本專(zhuān)業(yè)學(xué)術(shù)期刊上看到他的觀點(diǎn)?又有多少人會(huì)在推特上看到(并轉(zhuǎn)發(fā))他的推文?前者的數(shù)量肯定無(wú)法與后者相比吧。所以說(shuō),我們都應(yīng)該好好琢磨哲學(xué)家大衛(wèi)·休謨的一句至理名言:“根據(jù)證據(jù)的多寡來(lái)確定信仰的深淺……方為智者?!?/p>
專(zhuān)家的過(guò)度自信可能會(huì)導(dǎo)致非??膳碌暮蠊?986年“挑戰(zhàn)者號(hào)”航天飛機(jī)爆炸事件后的一項(xiàng)調(diào)查發(fā)現(xiàn),NASA(美國(guó)國(guó)家航空航天局)官方發(fā)布的預(yù)測(cè)稱(chēng),每10萬(wàn)次發(fā)射就會(huì)有1次失?。ㄅc穿過(guò)赫斯特大道時(shí)遭遇車(chē)禍的概率差不多)。然而其他證據(jù)顯示,NASA早已有非常可靠的證據(jù)表明上述預(yù)測(cè)過(guò)分樂(lè)觀。慘劇發(fā)生的5年前,NASA的專(zhuān)家就在一份報(bào)告中指出,(用于將“挑戰(zhàn)者號(hào)”送入軌道的)固體燃料火箭的歷史故障率為1/57(即每57次發(fā)射就有1次故障)。考慮到航天飛機(jī)每次發(fā)射都會(huì)使用兩枚固體燃料火箭,假設(shè)火箭的歷史故障率保持不變,那么航天飛機(jī)發(fā)射的失事率預(yù)計(jì)會(huì)達(dá)到1/28或1/29(即每28或29次發(fā)射就有1次故障)。1986年“挑戰(zhàn)者號(hào)”解體正逢第25次發(fā)射,所以這場(chǎng)悲劇幾乎是板上釘釘?shù)摹H欢?,NASA內(nèi)部肯定是發(fā)生了什么不為人知的事情,導(dǎo)致一個(gè)近乎百分之百悲觀的風(fēng)險(xiǎn)評(píng)估被轉(zhuǎn)變成了一個(gè)極為樂(lè)觀(且顯然不切實(shí)際)的預(yù)估,最終導(dǎo)致了慘劇的發(fā)生。
1986年“挑戰(zhàn)者號(hào)”航天飛機(jī)爆炸畫(huà)面
20世紀(jì)中葉,理論物理學(xué)家列夫·朗道對(duì)科學(xué)家群體中那些過(guò)度自信的專(zhuān)家做了一番精辟的描述:“雖然宇宙學(xué)家經(jīng)常出錯(cuò),卻從未受到過(guò)質(zhì)疑。”這句話或許略顯夸張,畢竟科學(xué)家有時(shí)候會(huì)撤回自己的錯(cuò)誤論斷。舉個(gè)例子,2010年,曾有23位專(zhuān)家聯(lián)合發(fā)表了一封致美聯(lián)儲(chǔ)時(shí)任主席本·伯南克的公開(kāi)信,他們?cè)谛胖行Q(chēng)伯南克的量化寬松政策將引發(fā)“貨幣貶值和通貨膨脹”。然而到了2014年,信中所說(shuō)的貨幣危機(jī)并沒(méi)有出現(xiàn),所有事實(shí)都充分說(shuō)明這些專(zhuān)家的論斷并不正確。兩位記者聯(lián)系了這23位專(zhuān)家,其中14位拒絕評(píng)價(jià),9位回應(yīng)者仍堅(jiān)稱(chēng)自己的觀點(diǎn)正確無(wú)誤?!都~約時(shí)報(bào)》專(zhuān)欄作家、諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主保羅·克魯格曼早前曾譏諷過(guò)這些“死鴨子嘴硬”的專(zhuān)家,他在2022年年初更是坦承自己的判斷失誤,即不認(rèn)為總統(tǒng)拜登2021年的經(jīng)濟(jì)刺激計(jì)劃將催生高通脹。他說(shuō):“我不想跟那些不肯承認(rèn)錯(cuò)誤的專(zhuān)家沆瀣一氣。因此,為了試圖搞清楚為什么我在去年年初就通脹的樂(lè)觀看法會(huì)與一系列事實(shí)相悖,到目前為止我已花了相當(dāng)多的時(shí)間?!比欢?,他也堅(jiān)持認(rèn)為自己最初的分析在基本面上是沒(méi)錯(cuò)的,突如其來(lái)的新冠疫情可以說(shuō)是顛覆過(guò)去經(jīng)濟(jì)運(yùn)行常態(tài)的罪魁禍?zhǔn)住#ń?jīng)濟(jì)本就是一種變幻莫測(cè)的高難度游戲,要撰文分析其動(dòng)態(tài)更是難上加難,盡管克魯格曼低估了通脹率,但就“拜登的經(jīng)濟(jì)刺激計(jì)劃在美國(guó)的高通脹中到底扮演了什么角色”這一問(wèn)題,誰(shuí)的論斷才是正確的,目前尚無(wú)定論。)
論智性謙遜的重要性
有了前車(chē)之鑒,專(zhuān)家和權(quán)威人士在人類(lèi)第三個(gè)千年面臨的挑戰(zhàn)就是:如何培養(yǎng)所謂的智性謙遜。對(duì)這一特質(zhì)有過(guò)多年研究的心理學(xué)家馬克·利里發(fā)現(xiàn),智性謙遜程度較高的人“更注重與所述事實(shí)相關(guān)的證據(jù)的力度”并“更有興趣了解人們不同意自身觀點(diǎn)的原因”。他指出:“在不同的文化中,人們對(duì)開(kāi)放性和靈活性的重視程度,以及對(duì)不確定性和模糊性的容忍程度,各不相同?!?/p>
硅谷最值得稱(chēng)道的地方在于,它形成了一種對(duì)錯(cuò)誤保持開(kāi)放態(tài)度的文化。硅谷最流行的一句口號(hào)是“快速失敗,經(jīng)常失敗”,這就是最好的佐證。當(dāng)然,這句話并不是推崇失敗,而是將失敗視為尖端技術(shù)開(kāi)發(fā)過(guò)程中不可避免的衍生品。事實(shí)上,許多科學(xué)家也秉持了類(lèi)似的理念,他們認(rèn)為每位研究生都難免會(huì)在某些實(shí)驗(yàn)中犯錯(cuò),因此,最好的應(yīng)對(duì)之法就是盡早積累大量的研究經(jīng)驗(yàn),盡早犯錯(cuò)并糾正。
最近,一個(gè)由心理學(xué)領(lǐng)域的年輕學(xué)者組成的團(tuán)體開(kāi)始在科學(xué)領(lǐng)域倡導(dǎo)“讓研究人員承認(rèn)錯(cuò)誤”的文化。在這個(gè)名為“置信度缺失”(Loss-of-Con?dence)的項(xiàng)目中,心理學(xué)家記錄了諸多科研人員曾經(jīng)發(fā)表但現(xiàn)在持懷疑態(tài)度的研究成果。他們對(duì)315名科學(xué)家進(jìn)行了一項(xiàng)匿名調(diào)查,結(jié)果發(fā)現(xiàn),44%的受訪者表示,在他們發(fā)表過(guò)的研究成果中,至少存在一項(xiàng)值得質(zhì)疑之處,但其中大多數(shù)人并未公開(kāi)承認(rèn)自己“置信度缺失”,或只在論壇上口頭承認(rèn),并未在發(fā)表了其研究成果的期刊上書(shū)面澄清。
校準(zhǔn)我們的置信水平
科學(xué)證據(jù)只能提供一定的可能性,而非絕對(duì)的確定性,這就意味著要求專(zhuān)家做到百分之百正確既愚蠢又不公平。即便專(zhuān)家盡善盡美地完成了自己的工作,也依然會(huì)有出錯(cuò)的時(shí)候,但我們可以合理地要求他們對(duì)其研究結(jié)果的置信水平進(jìn)行校準(zhǔn)。
這里的“校準(zhǔn)”是何意?如果專(zhuān)家提供了某個(gè)事件的發(fā)生概率,我們便可以縱觀不同的情況,看看其預(yù)測(cè)是否匹配該事件的發(fā)生頻率。而如果專(zhuān)家給出了一個(gè)絕對(duì)肯定的斷言(“這是腦瘤”),我們可以要求專(zhuān)家量化其論述為真的概率。如果專(zhuān)家提供了一項(xiàng)預(yù)估數(shù)據(jù),我們還可以要求他們給出一個(gè)從低到高的、可能包含了正確值在內(nèi)的預(yù)估范圍(專(zhuān)家要對(duì)這個(gè)估值有95%的把握)。
當(dāng)一個(gè)人在做預(yù)測(cè)時(shí)表述的置信水平與我們發(fā)現(xiàn)真實(shí)結(jié)果后得出的準(zhǔn)確率吻合時(shí),即為校準(zhǔn)得當(dāng)。為了讓學(xué)生理解這個(gè)概念,我們要求他們回答一個(gè)只有兩個(gè)選項(xiàng)的問(wèn)題:巴拿馬運(yùn)河和蘇伊士運(yùn)河,哪條河更長(zhǎng)?大多數(shù)學(xué)生連查都沒(méi)查過(guò),更遑論記住準(zhǔn)確答案了。當(dāng)然,我們無(wú)意調(diào)查學(xué)生對(duì)這些“無(wú)用事實(shí)”的掌握程度,而是想要知道他們?nèi)绾卧u(píng)估自己對(duì)每個(gè)答案選項(xiàng)的置信度。當(dāng)其表達(dá)的置信水平與正確概率基本一致時(shí),兩者就得到了完美校準(zhǔn)。例如,在一段時(shí)間里,你給出的置信水平為50%,那么你回答正確的時(shí)間和錯(cuò)誤的時(shí)間應(yīng)該各占一半。相應(yīng)地,如果你表示自己的置信度為100%,這就意味著你應(yīng)該總是對(duì)的。如果你的準(zhǔn)確率低于給出的置信度,說(shuō)明你過(guò)于自信,并且很可能低估了自己的無(wú)知程度。
下圖展示了學(xué)生們多年來(lái)進(jìn)行校準(zhǔn)練習(xí)的結(jié)果。當(dāng)學(xué)生給出的置信水平為50%(即答案基本靠猜)時(shí),他們實(shí)際的正確率略高于50%(或許是因?yàn)樗麄冋莆盏闹R(shí)高于他們自認(rèn)的水平)。然而,當(dāng)他們對(duì)自己的答案越來(lái)越有信心時(shí),實(shí)際準(zhǔn)確率卻始終低于預(yù)期。這種“經(jīng)典”的校準(zhǔn)模式顯示出了顯著的過(guò)度自信傾向,并得到面向不同人群的多項(xiàng)研究的一再驗(yàn)證。
這種過(guò)度自信導(dǎo)致校準(zhǔn)偏差的證據(jù)在專(zhuān)業(yè)人士身上同樣有所體現(xiàn)。20世紀(jì)初,幾位研究者曾針對(duì)德國(guó)股市預(yù)測(cè)員的過(guò)度自信進(jìn)行了調(diào)查,他們請(qǐng)350名金融專(zhuān)家按照月份順序預(yù)測(cè)了未來(lái)6個(gè)月的DAX指數(shù)水平。值得注意的是,每位專(zhuān)家需要為每次預(yù)測(cè)劃定一個(gè)90%的置信區(qū)間,即專(zhuān)家們認(rèn)為DAX指數(shù)十之有九會(huì)落在這個(gè)區(qū)間內(nèi)。最后的結(jié)果顯示:每個(gè)月DAX指數(shù)的實(shí)際值都完全落在了大部分專(zhuān)家6個(gè)月前給出的置信區(qū)間之外。事實(shí)上,在長(zhǎng)達(dá)26個(gè)月的研究中,在超過(guò)半數(shù)的時(shí)間段內(nèi),能給出較為寬泛的置信區(qū)間涵蓋當(dāng)月的DAX指數(shù)的實(shí)際值的專(zhuān)家人數(shù)不足總量的一半。換言之,這些專(zhuān)家中有許多人不僅在預(yù)判德國(guó)股市未來(lái)走向上大錯(cuò)特錯(cuò),而且對(duì)自身錯(cuò)誤程度的判斷能力也十分薄弱。
上面這句話實(shí)際上表達(dá)了校準(zhǔn)概念的關(guān)鍵含義,它包含了這樣一個(gè)概念,即除了知識(shí)(例如,你用來(lái)預(yù)測(cè)未來(lái)6個(gè)月DAX指數(shù)的知識(shí)),還存在元知識(shí),即你對(duì)已掌握知識(shí)的理解。上述研究表明,德國(guó)的金融專(zhuān)家提供的置信區(qū)間過(guò)小,說(shuō)明他們相當(dāng)缺乏元知識(shí),即他們對(duì)自己的知識(shí)盲區(qū)毫無(wú)概念。如果能夠提升自身的元知識(shí)(即校準(zhǔn)他們的置信水平),他們就可以預(yù)測(cè)得更精準(zhǔn)。
另一個(gè)例子來(lái)自菲利普·泰洛克對(duì)外交政策專(zhuān)家的研究。這些專(zhuān)家的預(yù)測(cè)會(huì)對(duì)國(guó)家政策產(chǎn)生深遠(yuǎn)影響,他們給出的預(yù)測(cè)會(huì)在某種程度上成為美國(guó)國(guó)會(huì)就軍事預(yù)算撥款,總統(tǒng)在制定外交、經(jīng)濟(jì)和軍事戰(zhàn)略并就相關(guān)條約進(jìn)行談判等重大事項(xiàng)的依據(jù)。這些專(zhuān)家對(duì)自己的預(yù)測(cè)越有信心,國(guó)會(huì)議員和美國(guó)總統(tǒng)的決策就越有可能受其影響。泰洛克的研究表明,對(duì)于此類(lèi)專(zhuān)家預(yù)測(cè),我們需要保持警惕。泰洛克組織了幾百位外交政策專(zhuān)家,請(qǐng)他們對(duì)5年和10年后的事件做出非是即否式的預(yù)測(cè)。例如,他請(qǐng)專(zhuān)家預(yù)測(cè)“2016年,普京還會(huì)是俄羅斯總統(tǒng)嗎”。除此之外,他還要求專(zhuān)家就自己預(yù)測(cè)結(jié)果的置信度從1到9分進(jìn)行打分。這項(xiàng)研究得出了兩個(gè)令人沮喪的結(jié)果:第一,專(zhuān)家給出預(yù)測(cè)的準(zhǔn)確率堪比隨機(jī)拋硬幣;第二,預(yù)測(cè)準(zhǔn)確率和專(zhuān)家給出的置信度基本無(wú)關(guān)。那些預(yù)測(cè)正確的專(zhuān)家給出的置信度平均值在6.5~7.6,而預(yù)測(cè)錯(cuò)誤的專(zhuān)家給出的置信度平均值在6.3~7.1,兩者之間不存在顯著差異。換言之,預(yù)測(cè)錯(cuò)誤和預(yù)測(cè)正確的專(zhuān)家一樣充滿自信。也就是說(shuō),將外交政策專(zhuān)家在給出預(yù)測(cè)時(shí)提供的置信度作為你判斷其預(yù)測(cè)是否可信的標(biāo)準(zhǔn),實(shí)際上不太可靠。
我們可能會(huì)期望,物理學(xué)家和其他自然科學(xué)領(lǐng)域的專(zhuān)家在校準(zhǔn)置信度方面做得比社會(huì)科學(xué)家更好,尤其是當(dāng)他們研究的主題是與政治無(wú)關(guān)的自然世界的特征時(shí)。畢竟,自然科學(xué)家掌握著海量的數(shù)據(jù)、擁有頻率分布和多重度量工具,還有高級(jí)的計(jì)算公式,只要將海量數(shù)據(jù)輸入其中,就能得到精確的置信區(qū)間。然而,自然科學(xué)領(lǐng)域的專(zhuān)家在判斷其研究結(jié)果置信度的合適區(qū)間時(shí),遭遇的困難絲毫不亞于金融和外交政策領(lǐng)域的專(zhuān)家。
有趣的是,我們之所以能了解自然科學(xué)家在置信度方面的部分現(xiàn)狀,是因?yàn)橛行┪锢韺W(xué)家一直特別想要了解其言論置信度的校準(zhǔn)情況。因此,他們對(duì)這個(gè)問(wèn)題進(jìn)行了長(zhǎng)達(dá)幾十年的跟蹤和研究。物理學(xué)是最早使用超大數(shù)據(jù)集的科學(xué)領(lǐng)域之一,全球各地的物理學(xué)家團(tuán)隊(duì)之間也有著邊競(jìng)爭(zhēng)邊合作的悠久傳統(tǒng),因此在20世紀(jì)50年代末和60年代初,物理學(xué)家開(kāi)始收集、比較和整合他們相互競(jìng)爭(zhēng)之下得出的測(cè)量結(jié)果及其置信度的預(yù)估值數(shù)據(jù),他們很快就發(fā)現(xiàn)了研究結(jié)果中的置信度錯(cuò)位跡象。例如,在試圖確定光速和電子質(zhì)量等物理常量的精確值時(shí),物理學(xué)家會(huì)在最初的測(cè)量結(jié)果報(bào)告中表達(dá)出顯著的不確定性,然后隨著研究的深入逐漸得出更精確的估值。換言之,他們的誤差棒一開(kāi)始應(yīng)該非常長(zhǎng),然后隨著一項(xiàng)項(xiàng)新研究的推進(jìn)逐漸變短,并且每次對(duì)物理常數(shù)的新測(cè)量都應(yīng)該在前一次測(cè)量的誤差范圍內(nèi)。然而事實(shí)并非如此,待物理學(xué)家將光速c的歷年測(cè)量估值(從1870年到20世紀(jì)60年代)及其誤差棒繪制出來(lái)后,他們發(fā)現(xiàn)這些估計(jì)值均呈四散分布狀態(tài),而且經(jīng)常出現(xiàn)以下情況:某項(xiàng)研究得出的估計(jì)值完全超出前一項(xiàng)研究給出的誤差范圍。這種不一致的、看起來(lái)毫無(wú)連貫性的現(xiàn)象同樣出現(xiàn)在對(duì)精細(xì)結(jié)構(gòu)常數(shù)、普朗克常數(shù)、電子電荷、電子質(zhì)量和阿伏伽德羅常數(shù)等物理常量的測(cè)算過(guò)程中。
當(dāng)然,縱觀光速值的整個(gè)測(cè)量歷史,每位科學(xué)家都認(rèn)定其研究結(jié)果代表了最接近真相的數(shù)值。例如,物理學(xué)家雷蒙德·伯奇曾在1941年寫(xiě)道:“在經(jīng)歷了漫長(zhǎng)的、有時(shí)甚至異常忙碌的工作之后,光速c的值終于穩(wěn)定下來(lái),達(dá)到了一個(gè)相當(dāng)令人滿意的‘穩(wěn)定’狀態(tài)?!比欢痪弥螅蠖鄶?shù)研究者對(duì)光速的估值都遠(yuǎn)遠(yuǎn)高于伯奇給出的結(jié)果,更是大大超出了他提供的置信區(qū)間,而當(dāng)下以高置信度著稱(chēng)的光速估值同樣遠(yuǎn)遠(yuǎn)超出了伯奇所說(shuō)的“穩(wěn)定”范圍。
在置信水平評(píng)估上經(jīng)歷了重大失敗之后,物理學(xué)家變得更加謹(jǐn)慎。他們不再輕易相信簡(jiǎn)單的內(nèi)部估算,開(kāi)始要求研究人員對(duì)結(jié)果進(jìn)行更多的交叉對(duì)比,以衡量其不確定性,并對(duì)科研人員宣布的科學(xué)發(fā)現(xiàn)提出了更加嚴(yán)苛的接受標(biāo)準(zhǔn)。然而,即便如此,廣大物理實(shí)驗(yàn)家給其學(xué)生留下的最大教訓(xùn)就是:他們?nèi)詴?huì)對(duì)自己的測(cè)量結(jié)果過(guò)度自信!
即使過(guò)度自信乃人之本性,但提升自身校準(zhǔn)能力也并非不可能。在某些情況下,我們完全可以出色地校準(zhǔn)結(jié)果的置信度。在研究過(guò)不同職業(yè)的置信度校準(zhǔn)情況后,你會(huì)發(fā)現(xiàn)氣象學(xué)家尤擅短期預(yù)測(cè)的校準(zhǔn)。如果氣象預(yù)報(bào)員表示明天有雨的概率為80%,那么你會(huì)發(fā)現(xiàn)第二天降雨的概率確實(shí)達(dá)到了八成。他們的校準(zhǔn)為何如此精確?關(guān)鍵原因可能是,氣象學(xué)家能不斷獲得關(guān)于這些預(yù)測(cè)的即時(shí)反饋。此外,氣象學(xué)家的元知識(shí)(即校準(zhǔn)程度的高低)決定著他們的職業(yè)聲望,其重要程度完全不亞于他們所掌握的氣象知識(shí)(準(zhǔn)確預(yù)測(cè))。
不管在哪個(gè)專(zhuān)業(yè)或領(lǐng)域,專(zhuān)業(yè)要求及社會(huì)文化力量都會(huì)影響人們對(duì)自身知識(shí)狀況的判斷。因此,了解哪些力量會(huì)影響到你對(duì)置信水平的校準(zhǔn),或能幫你識(shí)別那些悄悄將你推入過(guò)度自信陷阱的推動(dòng)力,并抵御它們的潛在影響。從這個(gè)意義上講,我們應(yīng)該努力向IBM(國(guó)際商用機(jī)器公司)研制的超級(jí)計(jì)算機(jī)沃森(Watson)學(xué)習(xí),它之所以能在美國(guó)電視智力競(jìng)賽節(jié)目《危險(xiǎn)邊緣》(Jeopardy!)中擊敗最優(yōu)秀的人類(lèi)選手,不僅是因?yàn)樗鼡碛锌氨染S基百科的廣博知識(shí),還要?dú)w功于其擁有的精明過(guò)人的元知識(shí)。
在《危險(xiǎn)邊緣》問(wèn)答挑戰(zhàn)賽中,元知識(shí)發(fā)揮著非常重要的作用,因?yàn)閷?duì)于主持人給出的每個(gè)“答案”,只有一名參賽者有機(jī)會(huì)提出“問(wèn)題”(以提問(wèn)的方式回答),即率先按下?lián)尨鹌鞯膮①愓?。比賽設(shè)定了回答錯(cuò)誤會(huì)受到懲罰的機(jī)制,以避免參賽選手純粹為了搶答而快速按下?lián)尨鹌?,確保選手只有在知道或認(rèn)為自己知道正確答案的情況下才會(huì)按下?lián)尨鹌?。因此,最終的勝出者往往是那些能夠快速判斷自己是否知道正確“問(wèn)題”的選手。沃森的程序使其能夠?qū)崟r(shí)完成自我評(píng)估和判斷,而且完成得非常出色。它很清楚自己的認(rèn)知盲區(qū),它的搶答基本上等同于告訴你:“在這種情況下,你應(yīng)該相信我,而在另一種情況下,你不需要相信我?!睂?duì)人類(lèi)專(zhuān)家而言,這是一種極具借鑒價(jià)值的思維方式。
對(duì)他人置信度的信心
現(xiàn)在,為了充分了解專(zhuān)家群體的過(guò)度自信現(xiàn)象,我們必須了解專(zhuān)家的預(yù)測(cè)和評(píng)估是如何使用的。首先需要從“觀察者”的角度來(lái)看待這個(gè)問(wèn)題,比如從醫(yī)生口中聽(tīng)取手術(shù)風(fēng)險(xiǎn)評(píng)估的病人、評(píng)估目擊證人所呈證詞真實(shí)性的陪審員、依據(jù)理財(cái)顧問(wèn)的股市預(yù)測(cè)做出投資決策的投資者。當(dāng)我們觀察這些案例并就“人們基于什么線索來(lái)判斷是否相信專(zhuān)家所言”這一問(wèn)題進(jìn)行研究時(shí),專(zhuān)家明確表達(dá)出的置信度就是最重要的線索。簡(jiǎn)而言之,顧問(wèn)、證人和專(zhuān)家越是自信,他們的話往往會(huì)被認(rèn)為具有更高的置信度。
這個(gè)邏輯發(fā)揮作用的一個(gè)領(lǐng)域就是刑事司法環(huán)境。在庭審時(shí),陪審員會(huì)聽(tīng)到目擊證人的證詞并判斷其可信度。這時(shí)候,目擊者扮演的是“專(zhuān)家”角色,而陪審員是“觀察者”。研究“陪審員使用什么線索來(lái)判斷目擊證人的可信度”的心理學(xué)專(zhuān)家可以設(shè)置模擬場(chǎng)景,先在公開(kāi)場(chǎng)合模擬犯罪事件,然后招募“犯罪行為”的真實(shí)目擊者在模擬陪審員面前做證。研究發(fā)現(xiàn),陪審員對(duì)證詞可信度的判斷,與對(duì)證人表現(xiàn)出的置信度的感知,存在相當(dāng)顯著的正相關(guān)關(guān)系,這表明陪審員可能在很大程度上依賴目擊證人表現(xiàn)出的置信度來(lái)決定“我是否應(yīng)該相信這個(gè)人說(shuō)的話”。
但這樣做的問(wèn)題在于,我們已經(jīng)知道針對(duì)某個(gè)預(yù)測(cè)或評(píng)估給出的置信度并不能有效地判斷其是否正確。如果將專(zhuān)家的置信度(不管是我們自認(rèn)為的,還是專(zhuān)家明確表達(dá)的)作為判斷其言論可信度的依據(jù),那么我們很容易就會(huì)被誤導(dǎo),并且還會(huì)據(jù)此做出錯(cuò)誤的決定。最終,陪審員可能會(huì)把無(wú)辜的人送進(jìn)監(jiān)獄,投資者可能會(huì)選錯(cuò)股票,病人則可能會(huì)選擇伴隨嚴(yán)重并發(fā)癥的手術(shù)方案,所有這一切嚴(yán)重的后果都是因?yàn)樗麄冨e(cuò)誤地把一個(gè)人給出的置信度,當(dāng)作了判斷其預(yù)測(cè)可信度和準(zhǔn)確性的合理依據(jù)。
萬(wàn)幸的是,已經(jīng)有證據(jù)表明,我們可以打破這種錯(cuò)誤的思維模式。當(dāng)自信滿滿的預(yù)測(cè)者、專(zhuān)家或證人在心理學(xué)研究中被證明為錯(cuò)后,他們給出的置信度就不再具有之前的分量,對(duì)觀察者結(jié)論的影響也變小了。一旦那些信誓旦旦的人被證明犯了錯(cuò),選擇相信他們的人就會(huì)感覺(jué)被背叛了。(相反地,如果專(zhuān)家或證人一開(kāi)始就對(duì)自己的預(yù)測(cè)或評(píng)估給出較低的置信度,在他們被證實(shí)為錯(cuò)時(shí),其可信度并不會(huì)因此而降低。)
在獲得關(guān)于專(zhuān)家意見(jiàn)的實(shí)際準(zhǔn)確性信息后,面對(duì)專(zhuān)家所表現(xiàn)出來(lái)的置信度暗示,觀察者便會(huì)自然而然地調(diào)整自身反應(yīng)。因?yàn)樵跍?zhǔn)確性已知的情況下,表達(dá)的置信度就不足以替代前者。然而,這里最大的難點(diǎn)在于觀察者要如何獲取關(guān)于準(zhǔn)確性的反饋,畢竟有時(shí)候人們根本不可能獲得關(guān)于專(zhuān)家意見(jiàn)實(shí)際準(zhǔn)確性的信息。此外,已經(jīng)有一些研究表明,如果不管采用何種方式獲得此類(lèi)反饋都比較費(fèi)力的話,很多人就會(huì)選擇偷懶,直接將專(zhuān)家表達(dá)的置信度作為準(zhǔn)確性的判斷依據(jù)。
那么專(zhuān)家有沒(méi)有可能做到兩全其美—既可避免過(guò)度自信又可避免犯錯(cuò)?一種方法就是給出一個(gè)大到幾乎確保能將真相涵蓋在內(nèi)的置信區(qū)間,如“拜登總統(tǒng)如果選擇參加連任競(jìng)選,我有95%的把握認(rèn)為他將獲得30%~70%的選票”。這種寬泛的說(shuō)法基本不可能出錯(cuò),但身為專(zhuān)家的兩難之處在于,發(fā)表這種無(wú)甚風(fēng)險(xiǎn)的意見(jiàn),就會(huì)導(dǎo)致沒(méi)人覺(jué)得他是一位專(zhuān)家了。(隨著估算范圍的縮小,置信度必然會(huì)降低:在預(yù)測(cè)拜登的得票率時(shí),同一個(gè)專(zhuān)家可能有70%的把握認(rèn)為拜登會(huì)獲得40%~60%的選票,有60%的把握認(rèn)為拜登會(huì)得到40%~50%的選票。)專(zhuān)家需要對(duì)自己的觀點(diǎn)進(jìn)行足夠好的校準(zhǔn)后才能顯得可信,但同時(shí)又要提供足夠多的信息以彰顯自身的專(zhuān)業(yè)性,這是個(gè)不容易實(shí)現(xiàn)的兩難目標(biāo)。好消息是,誠(chéng)實(shí)和符合實(shí)際地評(píng)估自己的置信度,能夠讓民眾對(duì)專(zhuān)家具備的專(zhuān)業(yè)知識(shí)保持信任。
提防你的過(guò)度自信
如果這世界上只有兩種專(zhuān)家—“準(zhǔn)確的”和“不準(zhǔn)確的”,那么大多數(shù)人更愿意聽(tīng)第一種而不是第二種專(zhuān)家的意見(jiàn)。然而,除了簡(jiǎn)單的問(wèn)題(根本不需要專(zhuān)家建議),期望專(zhuān)家總是提供百分之百正確的見(jiàn)解也是不切實(shí)際的。因此,專(zhuān)家是否在其論斷中提供了置信度聲明,是區(qū)分真專(zhuān)家和偽專(zhuān)家的重要信息來(lái)源,盡管這可能不符合大多數(shù)讀者的習(xí)慣思維!
下一次你在自己最喜歡的新聞節(jié)目中看到專(zhuān)家訪談時(shí),不妨仔細(xì)聽(tīng)聽(tīng)他們?nèi)绾蚊枋鲎约旱闹眯哦?。他們是否表達(dá)了絕對(duì)的肯定,還是使用了“有可能”、“存在……的風(fēng)險(xiǎn)”或“有一種觀點(diǎn)認(rèn)為……”等拐彎抹角的表述?在一個(gè)不確定性已成為常態(tài)的世界,我們本應(yīng)該嘉獎(jiǎng)那些校準(zhǔn)了自我的專(zhuān)家。不幸的是,專(zhuān)家常常承受著來(lái)自記者、政策制定者、律師和公眾的壓力,各方都要求他們必須看起來(lái)自信滿滿。
著名心理學(xué)家丹尼爾·卡尼曼說(shuō)過(guò),過(guò)度自信是人類(lèi)的一種偏差:“如果我有一根魔杖,我最想消除的就是這種偏差。”過(guò)度自信能否被消除,這仍有待商榷,但我們已經(jīng)看到,任何人都可以采取一些具體措施來(lái)減少過(guò)度自信的問(wèn)題。
丹尼爾·卡尼曼
第一點(diǎn)就是(或許我們沒(méi)有著重強(qiáng)調(diào)):不要覺(jué)得你必須就自己不太了解的事情發(fā)表意見(jiàn)?;蛟S你可以給自己設(shè)定一個(gè)嚴(yán)苛的“意見(jiàn)預(yù)算”:“我今天只允許自己發(fā)表5條意見(jiàn),所以最好三思而后行?!?/p>
如果你必須發(fā)表自己的意見(jiàn),最好能以概率的形式表達(dá),或者多少給自己劃定一個(gè)置信水平,例如:“我有75%的把握……”或者“我認(rèn)為很有可能……”
在聆聽(tīng)專(zhuān)家意見(jiàn)時(shí),請(qǐng)你留意他們是否承認(rèn)自己的意見(jiàn)存在不確定性,以及他們有可能在什么地方出錯(cuò)。我們當(dāng)然希望專(zhuān)家能百分之百地正確,但這是不可能的。我們能做的就是竭盡全力尋找那些接近百分之百正確的專(zhuān)家。要記住,那些告訴你“我掌握的東西還不夠多,無(wú)法提供確切意見(jiàn)”的專(zhuān)家也并非一無(wú)是處,這樣坦誠(chéng)的說(shuō)法表明他們是可靠且值得信賴的。如果在你眼中,這些專(zhuān)家已經(jīng)是這方面知識(shí)最淵博的人,那么他們其實(shí)想告訴你的是,這是一個(gè)需要所有人更努力進(jìn)一步探索的課題。此外,如果你必須采取行動(dòng),就會(huì)知道最好謹(jǐn)慎行事,并謙遜地承認(rèn)還有很多未知的東西等著我們?nèi)ヌ剿鳌?/p>
本文節(jié)選自《第三個(gè)千年思維》([美]索爾·珀?duì)栺R特 [美]約翰·坎貝爾 [美]羅伯特·麥考恩 著,彭相真 譯,中信出版社,2025年2月版)