4.警察與小偷的故事——混合策略問題
納什在《n人博弈的均衡點》這篇論文中,給出了均衡存在的簡單證明,納什說,在n個人的博弈中至少存在一個均衡,在這點上雙方均不愿意先改變策略。這里的均衡點有可能是混合策略點。人們稱它為納什定理。
什么是混合策略?
我們來看一個混合策略的例子。警察部門負責一城市中某一區(qū)的治安。警察要對該區(qū)的A、B兩地進行巡邏。假定該區(qū)有一群小偷,要實施偷盜。警察要防止這些小偷的偷盜,但因為設備有限,只有一部警車,警察只能一次在一個地方巡邏。而對于小偷而言,他們也只能去一個地方。假定A地需要保護的財產價值為2萬元,B地的財產價值為1萬元。若警察在某地進行巡邏,而小偷也選擇了去該地,因警察在場,小偷無法偷盜該地的財物;若警察沒有去某地巡邏而小偷選擇了去該地,則小偷偷盜成功。警察怎么巡邏才能使效果最好?
一個明顯的做法是,警察對A地進行巡邏,小偷去B地,這樣,警察可以保住2萬元的財產不被偷竊,而小偷的穩(wěn)定收益為1萬元。但是這種做法是警察的最好做法嗎?警察有沒有比這種策略更好的策略?
我們可以將警察與小偷之間的這個支付寫成如下的支付矩陣。警察巡邏某地,偷盜者在該地無法實施偷盜,假定此時小偷的得益為0(沒有收益),此時警察的得益為3(保住3萬元)。
這個博弈也是常和博弈,它沒有純策略納什均衡點,而有混合策略均衡點。這個混合策略均衡點下的策略選擇是每個參與人的最優(yōu)(混合)策略選擇。
小偷
警察 襲擊A地 襲擊B地
巡邏A地 3,0 2,1
巡邏B地 1,2 3,0
對于這個例子,警察的一個更好的策略是,警察用擲骰子的方法決定去A地還是B地。假定警察規(guī)定擲到1-4點去A地,擲到5、6兩點去B地,這樣警察有2/3的機會去A地進行巡邏,1/3的機會去B地。
而小偷的最優(yōu)選擇是:以同樣擲骰子的辦法決定去A地還是去B地偷盜,如擲到1-4點去B地,擲到5、6兩點去A地,那么,小偷有1/3的機會去A地,2/3的機會去B地。
此時警察與小偷所采取的便是混合策略。
假如按這種策略,我們看一下雙方的收益。警察的期望得益是:7/3萬大于2。警察按此辦法比只巡邏A地的收益更高。
一旦警察采取混合策略,小偷也采取混合策略,其最優(yōu)混合策略下的收益為2/3萬元。小偷的收益比警察只巡邏A地的收益要低。
因為:當警察去A地巡邏時,小偷有1/3的機會去A地,2/3的機會去B地,此時警察去A地的得益為: 萬元;當警察去B地時,同樣,小偷有1/3的機會去A地,2/3的機會去B地,此時警察A地的得益為: 萬元。
警察總的得益為: 萬元。
同理,我們可得小偷的總的得益為2/3萬元。
這里我們“讓”警察和小偷擲骰子以確定去A地還是去B地,目的是要去A地和去B地之間確定一個概率分布,他們當然可用其他方式來確定這個概率分布。
宰割博弈中警察與小偷所用的混合策略,如同小孩子之間玩“剪刀-石頭-布”的游戲時所用的策略。在“剪刀-石頭-布”這樣的游戲中,不存在純策略均衡,對每個小孩來說,自己采取出“剪刀”、“布”還是“石頭”的策略應當是隨機的,不能讓對方知道自己的策略,哪怕是傾向性的策略。如果對方知道你出其中一個策略的可能性大,那么你在游戲中輸的可能性就大。因此,每個小孩的最優(yōu)混合策略是采取每個策略的可能性是1/3。在這樣的博弈中,每個小孩各取三個策略的1/3是納什均衡。
由此可見:純策略是參與人一次性選取的,并且堅持他選取的策略;而混合策略是參與人在各種備選策略中采取隨機選取的。在博弈中,參與人可以改變他的策略,而使得他的策略選取滿足一定的概率分布。
若博弈是零和博弈,即若博弈參與人為兩人,一方所得是另外一方的所失,或者若博弈是常和博弈,即若博弈參與人為兩人,一方所得的增加等于另外一方的損失,此時,對于任何一個參與人而言,都不可能有純策略的占優(yōu)策略。博弈參與人采取混合策略是合適的,均衡為混合策略均衡。如在當前的“反恐”博弈中,由于力量的有限,反恐方往往“更多地”將力量放在重點區(qū)域,如人口密集的大城市,“一定程度地”關注不太危險的區(qū)域,如人口稀疏的農村。這就是混合策略。而恐怖分子同樣在玩混合策略:對攻擊對象的選擇是隨機的,對攻擊方式的選擇也是隨機的。
在競爭性的博弈中,該采取混合策略而不采取混合策略將會帶來失敗。田忌賽馬是人人熟悉的故事。齊王與田忌賽馬,但齊王的馬平均來說要比田忌的馬要跑得快,但田忌采納了孫臏的策略,田忌用下等馬對齊王的上等馬,上等馬對齊王的中等馬,中等馬對齊王的下等馬。田忌以三比二獲勝,贏了齊王。賽馬是零和博弈,齊王的失敗在于他使用了純策略;若齊王使用混合策略,即每次比賽用馬采取隨機策略,不讓田忌預先知曉,那么田忌獲勝的機會必定大大小于齊王獲勝的機會,齊王不會發(fā)生必輸的結局。因此,齊王的錯誤在于沒有使用混合策略。
應當說明的是,田忌賽馬是著名的中國古代博弈故事。但其田忌獲勝的博弈結果則不是博弈論所能夠給出的。博弈論假定了每個參與人都是絕頂聰明的(理性的),博弈論給出的是,田忌和齊王都應采取混合策略,此時有一個混合策略均衡。田忌賽馬從反面印證了納什均衡的含義:若某個參與人主動改變均衡策略,他的收益會降低。這里,主動改變均衡策略而收益降低的參與人是齊王。