正文

“囚徒困境”的行為學檢驗

怪誕博弈論 作者:孫恩棣


假設你正和某人玩有限次數(shù)為100次的重復博弈,而且你知道他并不是一個百分百理性的人。結果會怎樣?

有人用計算機模擬了一個虛擬社會,里面有三種人:總是吃虧的“濫好人”,總是坑人的“奸詐人”,以及吃虧后反擊的“學習人”。100次博弈之后,“濫好人”死光了,“奸詐人”被“學習人”報復死光了,只有“學習人”活了下來。博弈論專家總結:人應該具備4種品質:·善良,不首先坑害人。

·敢憤怒,吃虧要知道反擊。

·寬恕,要給人改正的機會。

·磊落,表明自己的原則,且堅持之。現(xiàn)實生活中,有一些人的“善念”都超過了應有的程度,但這不等于說他們喜歡被占便宜。

從理論上來講,在重復100次的囚徒困境博弈中,理性的雙方之所以絕對不可能善待對方,原因就在于在最后一次博弈中選擇背叛才合乎“理性”。既然理性的對手在第100回合一定會背叛你,你在第99回合就應該背叛他。同樣的,既然你在第99回合會背叛他,他在第98回合就應該對你使壞,以此類推……

不過,要是你對對手的理性程度有所質疑,你可能會想要在第一回合選擇善意合作,這并不表示非理性對你的對手有利,而是表示“看起來非理性”對他有利。

有趣的是,就算你們兩個都很理性,兩人皆善意合作的結果還是有可能延續(xù)到最后一回合。假如雙方都很理性,但沒有人能百分之百確定對方很理性,那么雙方可能就會理性地選擇善意合作,并持續(xù)到最后幾回合。

傳統(tǒng)博弈論指出,當兩個人陷入有限次數(shù)重復性博弈中的囚徒困境時,他們一般會選擇使壞。不過,博弈論應該算是科學,而只要談到科學,自然就少不了實驗測試。

實驗證明,當我們實際陷入有限次數(shù)重復性博弈中的囚徒困境時,他們往往會善待對方,尤其是在前面幾回合。理論與現(xiàn)實之間為什么會出現(xiàn)這種落差?

這就涉及了近年來興起的“行為博弈論”的概念。

傳統(tǒng)的博弈論假設參與者(palyer)是理性且完全關注自身利益的。但心理學和行為科學的研究發(fā)現(xiàn),人們也有很多與此假設相悖的行為,比如人們會有公平心理和平等傾向。


上一章目錄下一章

Copyright ? 讀書網(wǎng) www.dappsexplained.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號