正文

重復(fù)性博弈的囚徒困境

怪誕博弈論 作者:孫恩棣


假如你和同一個(gè)對(duì)手玩了100次的囚徒困境博弈,會(huì)出現(xiàn)什么情況?假如你只玩這個(gè)博弈一次,你很可能使壞。假如你的對(duì)手使壞,你也跟著使壞就會(huì)得1分,好心則會(huì)得0分。假如你的對(duì)手心存善念,你使壞就會(huì)得3行,好心則會(huì)得2分。因此,不管對(duì)手怎么做,假如這個(gè)博弈只玩一次,壞心對(duì)你一定比較有利。但假如你們要玩100次,情況會(huì)變成什么樣子?

假如在整個(gè)博弈中,你們兩個(gè)一直使壞,每次雙方就只能各得1分的報(bào)酬。但要是你們兩個(gè)一直善意合作,雙方的報(bào)酬就是每回合2分。假如你開(kāi)始使壞,對(duì)手就會(huì)跟著使壞,于是雙方就會(huì)形成只得1分報(bào)酬的僵局。所以你寧可先展現(xiàn)善意,希望他也跟進(jìn),假如他不使壞,你的確可以占他便宜而使壞一回合。不過(guò),等這回合結(jié)束后,他也就不會(huì)再心存善念了。接下來(lái)你就會(huì)陷入每次只得1分的窘境,因?yàn)樽源酥?,他大概?huì)一直使壞下去。因此,你起碼應(yīng)該保持善意到他對(duì)你使壞為止。

遺憾的是,最后一次的問(wèn)題會(huì)阻止所謂理性的雙方善待對(duì)方,就算是第一回合也一樣,想想看,在第100次,也就是最后一次時(shí),你應(yīng)該采取什么策略?在這個(gè)回合中,使壞帶給你的報(bào)酬一定比善意來(lái)得高。假如你會(huì)在某個(gè)回合選擇好心,唯一可能的原因就是為了讓對(duì)手在下一回合選擇好心(還記得在類(lèi)似的同步行動(dòng)博弈中,當(dāng)你行動(dòng)的時(shí)候,對(duì)手并不知道你會(huì)怎么做;因此,你在任何一回合的選擇都不會(huì)影響對(duì)手在該回合的行動(dòng))。不過(guò),最后一次顯然不必考慮到其他回合。因此,在第100回合時(shí),你肯定應(yīng)該選擇壞心,你的對(duì)手也應(yīng)該這么做。

既然如此,你在第99回合應(yīng)該怎么做?你在第99次選擇使壞一定可以得到比較高的報(bào)酬。假如你不想在第99回合選擇壞心,唯一的理由就是為了讓對(duì)手在第100回合對(duì)你好心。但前面已經(jīng)說(shuō)過(guò),不管怎么樣,你的對(duì)手在第100回合都應(yīng)該會(huì)對(duì)你使壞。因此,雙方在第99回合都應(yīng)該選擇使壞。當(dāng)然,這表示你們兩個(gè)在第98回合也應(yīng)該選擇使壞,因?yàn)殡p方在第99和第100回合一定會(huì)選擇使壞。你可以把這個(gè)邏輯一直往回推,并借此證明你在第一回合就應(yīng)該選擇使壞!

 因此,就算這個(gè)囚徒困境博弈玩100次、1000次或是10億次,理性的參與者在每個(gè)回合都應(yīng)該會(huì)選擇使壞,只要這個(gè)博弈存在確定的最后一次。


上一章目錄下一章

Copyright ? 讀書(shū)網(wǎng) www.dappsexplained.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)