正文

1.基本術(shù)語(yǔ)(1)

博弈生存 作者:潘天群


前面已經(jīng)指出,博弈論研究的對(duì)象是理性的行動(dòng)者或參與人面對(duì)他人,如何選擇策略或如何作出行動(dòng)的決定的。理性的人是對(duì)現(xiàn)實(shí)的人的抽象,理性的人是指能夠進(jìn)行推理的人,而博弈中的理性的人是指能夠運(yùn)用推理能力使自己的目標(biāo)最大化的人?!袄硇缘摹迸c“道德的”不是一回事,理性的與道德的有時(shí)會(huì)發(fā)生沖突,但是理性的人不一定是不道德的。我們?cè)诤竺娴恼鹿?jié)中將闡述理性的人怎么會(huì)產(chǎn)生道德的行為。

博弈涉及哪些內(nèi)容呢?

第一, 一個(gè)博弈涉及至少兩個(gè)獨(dú)立的博弈參與人(player)。

一個(gè)博弈是一個(gè)活動(dòng),該活動(dòng)至少有兩個(gè)參與人,下文有時(shí)將參與人稱為行動(dòng)者。每個(gè)參與人通過(guò)行動(dòng),努力使自己的效用或利益最大化。但是,他的行動(dòng)的好處或支付取決于另外的參與人。

“囚徒博弈”或“囚徒困境”是一個(gè)被廣泛談及和研究的博弈。兩個(gè)共同作案偷竊的小偷被警察抓住,被帶進(jìn)警察局單獨(dú)關(guān)押。他們面臨的“政策”是“坦白從寬,抗拒從嚴(yán)”,具體的政策是:如果一方與警方合作,招認(rèn)并供出自己與對(duì)方以前所做違法之事,而對(duì)方不招認(rèn),招認(rèn)方無(wú)罪釋放,不招認(rèn)的另一方則會(huì)被判重刑10年;如果雙方都與警方合作共同招認(rèn),各被判刑5年;而如果雙方均不承認(rèn)有罪,因警察找不到他們以前違法的證據(jù),只能對(duì)他們的小偷行為進(jìn)行懲戒,各被判刑3個(gè)月。這兩個(gè)小偷如何作出選擇?

在這個(gè)囚徒困境中,參與人為兩個(gè)小偷。每個(gè)小偷的最后結(jié)果——是當(dāng)場(chǎng)釋放還是被判刑(10年、5年、3個(gè)月),不僅取決于他自己的決定,而且還取決于另外一個(gè)小偷的決定。

買賣活動(dòng)是日常生活中的常見(jiàn)現(xiàn)象。我們知道,在買賣的交換行為中,買東西的人要盡量以低的價(jià)格買到,但是他是否能買到取決于賣者是否能賣;賣東西的人想以盡量高的價(jià)格將東西賣出去,但價(jià)格太高,買者不接受,因此賣東西的人能否將物品賣出去取決于買者。

囚徒困境是一個(gè)博弈,買賣的交易活動(dòng)也是博弈。我們可看到,在任何一個(gè)博弈之中,至少存在兩個(gè)理性的參與人,他們的利益是相關(guān)的,即他們每個(gè)人的利益受其他人的行動(dòng)影響。

第二, 博弈中行動(dòng)者或參與人存在策略(strategy)選擇的可能。

博弈論用策略空間來(lái)表示參與人可以選擇的策略集。

赤壁一戰(zhàn),曹兵大敗,曹操落荒而逃,在選擇是走通往華容道的小路,還是選擇大路時(shí),曹操需要在兩個(gè)策略之間進(jìn)行選擇:“走大路”還是“走小路”。曹操最終選擇“走小路”。囚徒困境中的小偷面臨著“不招認(rèn)”還是“招認(rèn)”的選擇。

不同策略下的后果往往是有差異的,否則便不存在選擇的必要。對(duì)每個(gè)參與人而言,如果沒(méi)有不同選擇的可能,理性的計(jì)算便是多余的,對(duì)自己的目標(biāo)也就無(wú)能為力。從這個(gè)意義上來(lái)講,我國(guó)改革開放走向市場(chǎng)經(jīng)濟(jì),就是使得每個(gè)經(jīng)濟(jì)主體有選擇的可能,這樣人們才能發(fā)揮其理性的作用,使每個(gè)人的經(jīng)濟(jì)狀況更好,而在計(jì)劃經(jīng)濟(jì)下因沒(méi)有可選擇的余地,每個(gè)人的理性計(jì)算能力便無(wú)從施展。

第三,參與人在不同策略組合下會(huì)得到一定的支付(payoff)。

我們往往用支付矩陣來(lái)表示參與人在各種策略組合下的支付。 這個(gè)方法簡(jiǎn)單,比用函數(shù)來(lái)表示直觀、易于理解,當(dāng)然它的缺陷是,它只能表示兩個(gè)人的博弈結(jié)構(gòu)。囚徒困境的支付矩陣為:

乙 不招認(rèn) 招認(rèn)

不招認(rèn) 各被判刑3個(gè)月 甲:當(dāng)場(chǎng)釋放

乙:被判刑10年,

招認(rèn) 甲:被判刑10年

乙:當(dāng)場(chǎng)釋放 各被判刑5年

這個(gè)矩陣表示的是:若甲選擇“招認(rèn)”、乙選擇“招認(rèn)”,甲乙各被判刑5年;若甲選擇“招認(rèn)”、乙選擇“不招認(rèn)”,甲被當(dāng)場(chǎng)釋放,乙被判刑10年;若甲選擇“不招認(rèn)”、乙選擇“招認(rèn)”,甲被判刑10年,乙被當(dāng)場(chǎng)釋放;若甲選擇“不招認(rèn)”、乙選擇“不招認(rèn)”,甲乙均被判刑3個(gè)月。

我們?cè)賮?lái)刻畫一交易過(guò)程的支付矩陣。在賣主甲和買主乙之間的“買-賣”博弈中——這是一討價(jià)還價(jià)過(guò)程,通過(guò)討價(jià)還價(jià)后一個(gè)價(jià)格被確定。在此價(jià)格下我們假定,賣者賣成后獲得的效用為6,賣不成的效用為0;買者買成的效用為4,買不成的效用為0。而如果他們之間的交易不成功,無(wú)論是買主還是賣主都要等待并再次進(jìn)行討價(jià)還價(jià),這需要成本。假定等待和討價(jià)還價(jià)的成本均為1,則支付矩陣為:

甲 買成 買不成

賣成 6,4 5,0

賣不成 0,3 0,0

這兩個(gè)矩陣表明,在每個(gè)策略組合下參與人有一個(gè)收益值或支付值。


上一章目錄下一章

Copyright ? 讀書網(wǎng) www.dappsexplained.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)