什麼是博弈論?它有哪些應用?

馬里蘭大學羅伯特·H·史密斯商學院榮譽退休教授索爾·I·加斯解釋道。

博弈:一種競爭性活動,涉及兩人或多人根據一套規則進行的技巧、運氣或耐力,通常是為了自己或觀眾的娛樂(《蘭登書屋英語詞典》,1967年)。

考慮以下現實世界的競爭情況:導彈防禦、新車價格戰、能源監管、稅務審計、電視節目“倖存者”、恐怖主義、納斯卡賽車、勞資談判、軍事衝突、拍賣競標、仲裁、廣告、選舉和投票、農業作物選擇、衝突解決、股票市場、保險和電信。它們有什麼共同之處?


支援科學新聞報道

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您將幫助確保有關塑造我們當今世界的發現和想法的具有影響力的故事的未來。


一個基本例子有助於說明這一點。在學會下井字棋後,您可能發現了一種玩法策略,使您能夠至少打成平局,甚至在對手犯錯並且您注意到時獲勝。堅持該策略可確保您不會輸。

這個簡單的遊戲說明瞭現在所謂的博弈論的本質。在博弈論中,博弈是描述它的規則集。從開始到結束的遊戲例項稱為博弈的一局。純策略——例如您為井字棋找到的策略——是一個總體計劃,指定在遊戲過程中可能出現的所有意外情況中應採取的行動。如果在一局遊戲中,所有規則、可能的選擇以及任何玩家過去的博弈歷史都為所有參與者所知,則稱該博弈具有完全資訊。像井字棋、雙陸棋和國際象棋這樣的遊戲是具有完全資訊的遊戲,此類遊戲可以透過純策略來解決。但是,雖然您可能能夠描述井字棋的所有此類純策略,但不可能對國際象棋這樣做,因此後者具有悠久的神秘感。

像擲硬幣、石頭剪刀布或撲克這樣沒有完全資訊的遊戲給玩家帶來了挑戰,因為沒有純策略可以確保獲勝。對於擲硬幣,您有兩種純策略:擲正面或反面。對於石頭剪刀布,您有三種純策略:出石頭、布或剪刀。在這兩種情況下,您都不能只是不斷地使用純策略,例如正面或石頭,因為您的對手很快就會發現並使用相關的獲勝策略。該怎麼辦?我們很快學會透過隨機化我們每次博弈的策略選擇來迷惑我們的對手(對於正面反面,只需將硬幣拋向空中,看看會出現什麼情況,以實現 50-50 的分配)。還有其他方法可以控制我們如何隨機化。例如,對於石頭剪刀布,我們可以擲一個六面骰子,並決定一半時間選擇石頭(擲出數字 1、2 或 3),三分之一的時間選擇布(擲出數字 4 或 5),或者六分之一的時間選擇剪刀(擲出數字 6)。這樣做會傾向於向對手隱藏您的選擇。但是,透過以這種方式混合策略,您應該期望從長遠來看會贏還是輸?您應該玩的最佳策略組合是什麼?您期望贏多少?這就是現代數學博弈論發揮作用的地方。

像擲硬幣和石頭剪刀布這樣的遊戲被稱為兩人零和博弈。零和意味著玩家 1 贏得(或輸掉)的任何錢與玩家 2 輸掉(或贏得)的錢完全相同。也就是說,玩遊戲不會創造或損失任何錢。大多數室內遊戲都是多人零和博弈(但如果您在賭場玩撲克,賭場會抽取一定比例的彩池來支付其管理費用,則該遊戲不是零和博弈)。對於兩人零和博弈,20 世紀最著名的數學家約翰·馮·諾伊曼證明,所有此類博弈都對雙方玩家都有最優策略,並具有相關的博弈期望值。這裡的最優策略,假設遊戲被多次玩,是各個純策略的專門隨機組合。博弈的價值,用 v 表示,是玩家(比如玩家 1)如果堅持指定的最優策略組合,無論玩家 2 使用何種策略組合,都保證至少贏得的價值。同樣,玩家 2 如果堅持指定的最優策略組合,無論玩家 1 使用何種策略組合,都保證不會輸掉超過 v 。如果 v 是一個正數,那麼玩家 1 可以期望贏得該金額,在多次博弈中平均計算,玩家 2 可以期望輸掉該金額。如果 v 是一個負數,則情況相反。如果 v = 0,則稱這樣的博弈是公平的。也就是說,從長遠來看,雙方玩家都可以期望贏得 0。兩人零和博弈的數學描述並不難構建,並且確定最優策略和博弈價值在計算上也很簡單。我們可以證明擲硬幣是一個公平的遊戲,並且雙方玩家都具有相同的最優策略組合,即每次隨機選擇正面或反面的機率為 50%。石頭剪刀布也是一個公平的遊戲,並且雙方玩家都具有最優策略,即每次選擇每種選擇的機率為三分之一。並非所有零和博弈都是公平的,儘管大多數兩人零和室內遊戲都是公平的遊戲。那麼我們為什麼要玩它們呢?它們很有趣,我們喜歡競爭,而且,由於我們通常玩的時間很短,平均獎金可能與 0 不同。嘗試一下以下 v = 1/5 的遊戲。

騙局遊戲: 兩名玩家各獲得一張方塊 A 和一張梅花 A。玩家 1 還獲得一張方塊 2,玩家 2 獲得一張梅花 2。在一局遊戲中,玩家 1 展示一張牌,而玩家 2 在不知道玩家 1 選擇的情況下展示一張牌。如果花色匹配,則玩家 1 獲勝,如果花色不匹配,則玩家 2 獲勝。獲勝金額(收益)是獲勝者牌的點數值。但是,如果展示出兩張 2,則收益為零。[在這裡,如果收益以美元計算,玩家 1 可以期望贏得 0.20 美元。這個遊戲是嘉年華騙子(玩家 1)的最愛;他的最優混合策略是永遠不出方塊 A,60% 的時間出梅花 A,40% 的時間出方塊 2。]

博弈論的力量遠遠超出了對如此相對簡單的遊戲的分析,但複雜性確實會出現。我們可能會遇到多人競爭的情況,其中玩家可以結成聯盟併合作對抗其他玩家;多人非零和博弈;具有無限數量策略的博弈;以及兩人非零和博弈,僅舉幾例。對此類博弈的數學分析導致了馮·諾伊曼兩人零和博弈最優解結果的推廣,稱為均衡解。均衡解是一組混合策略,每個玩家一個,這樣每個玩家都沒有理由偏離該策略,假設所有其他玩家都堅持他們的均衡策略。然後我們得到了博弈論解的重要推廣:任何多人非合作有限策略博弈都至少有一個均衡解。約翰·納什證明了這一結果,並在電影《美麗心靈》中得到了描繪。《美麗心靈》(西爾維婭·娜薩爾著;西蒙與舒斯特出版社,1998 年)一書提供了更現實和更精彩的故事。

到目前為止,您已經得出結論,對關於競爭情況的開頭問題的答案是“博弈論”。所有引用的領域的各個方面都已使用博弈論技術進行了分析。網站 www.gametheory.net 列出了大約 200 篇最近的參考文獻,分為 20 個類別。然而,重要的是要注意,對於許多競爭情況,博弈論實際上並沒有解決手頭的問題。相反,它有助於闡明問題,併為我們提供了另一種解釋競爭互動和可能結果的方式。博弈論是運籌學、經濟學、金融、監管、軍事、保險、零售營銷、政治、衝突分析和能源等領域專業人士的標準分析工具,僅舉幾例。有關博弈論的更多資訊,請訪問上述網站和 http://william-king.www.drexel.edu/top/eco/game/game.html。

卡爾·西格蒙德、恩斯特·費爾和馬丁·A·諾瓦克撰寫的《公平競爭的經濟學》(《大眾科學》,2002 年 1 月)可從 大眾科學 Digital 購買。《博弈論與經濟行為》,J. 馮·諾伊曼和 O. 摩根斯坦,1947 年,普林斯頓大學 《博弈、理論與應用》,L. C. 托馬斯,哈爾斯特德出版社,1984 年 《囚徒困境》,W. 龐德斯通,雙日出版社,1992 年 《博弈論與策略》,P. D. 斯特拉芬,美國數學協會,1993 年

© .