興奮劑博弈:使作弊者成為失敗者的回報

加入我們的科學愛好者社群!

編者按:本文是“興奮劑困境”專題的一部分,該專題出自《大眾科學》2008年4月刊

為什麼腳踏車手作弊?對腳踏車運動中興奮劑的博弈論分析(如下所示)與囚徒困境的博弈非常相似,它揭示了為什麼基於當前比賽中內建的激勵和預期收益,使用興奮劑作弊是理性的。(預期收益是指成功結果的價值乘以實現該結果的機率。)假設的回報並非不切實際,但僅用於說明;矩陣中的“高”,“誘惑”,“傻瓜”和“低”標籤對應於囚徒困境中策略的標準名稱。還假設如果競爭對手在“公平的競爭環境”下(所有人都在作弊,或所有人都在遵守規則),他們的總獎金將均為100萬美元,而不對興奮劑優勢進行進一步調整。

—彼得·布朗,特約編輯


關於支援科學新聞

如果您喜歡這篇文章,請考慮透過 訂閱來支援我們屢獲殊榮的新聞報道。透過購買訂閱,您將有助於確保關於塑造當今世界的發現和想法的有影響力的故事的未來。


博弈假設:當前比賽

  • 贏得環法腳踏車賽的價值:1000萬美元

  • 使用興奮劑的車手在與未使用興奮劑的競爭對手比賽中贏得環法腳踏車賽的可能性:100%

  • 當比賽環境公平時的職業腳踏車手一年的價值:100萬美元

  • 被抓作弊的成本(處罰和收入損失):100萬美元

  • 被抓作弊的可能性:10%

  • 被車隊解僱的成本(放棄的收入和地位損失):100萬美元

  • 未使用興奮劑的車手因缺乏競爭力而被車隊解僱的可能性:50%

情況一:我的對手遵守規則(他“合作”)。我有兩個選擇

情況二:我的對手透過使用興奮劑作弊(他“背叛”)。同樣,我有兩個選擇

高回報

傻瓜回報

我也遵守規則(我也“合作”)。比賽環境是公平的。

我遵守規則(我“合作”)。只有當我的對手被抓作弊並被取消資格時,我才能獲得有競爭力的賽車手平均獎金。

比賽一年的價值

100萬美元

比賽一年的預期價值:100萬美元 * 10% =

10萬美元

由於我沒有作弊,我預計不會受到處罰

$0

被車隊解僱的預期成本:100萬美元 * 50% =

-50萬美元

總預期高回報

100萬美元

總預期傻瓜回報

40萬美元

誘惑回報

低迴報

我透過使用興奮劑作弊(我“背叛”)。

我也透過使用興奮劑作弊(我“背叛”)。比賽環境是公平的。

贏得環法腳踏車賽的預期價值(如果我沒有被抓作弊):1000萬美元 * 90% =

900萬美元

比賽一年的預期價值(如果我沒有被抓到):100萬美元 * 90%

90萬美元

作弊的預期處罰(如果我被抓到):100萬美元 * 10% =

-10萬美元

作弊的預期處罰(如果我被抓到):100萬美元 * 10% =

-10萬美元

總預期誘惑回報

890萬美元

總預期低迴報

80萬美元

由於890萬美元大於100萬美元,我在情況一中的動機是作弊。

我在情況二中的動機也是作弊。

博弈假設:改革後

  • 被抓作弊的新增高成本(處罰和收入損失):500萬美元

  • 被抓作弊的新增高可能性:90%

  • 因此,未使用興奮劑的車手因缺乏競爭力而被車隊解僱的新增低可能性:10%

情況一:我的對手遵守規則(他“合作”)。我有兩個選擇

情況二:我的對手透過使用興奮劑作弊(他“背叛”)。同樣,我有兩個選擇

高回報

傻瓜回報

我也遵守規則(我也“合作”)。比賽環境是公平的。

我遵守規則(我“合作”)。只有當我的對手被抓作弊並被取消資格時,我才能獲得有競爭力的賽車手平均獎金。

比賽一年的價值

100萬美元

比賽一年的預期價值:100萬美元 * 90% =

90萬美元

由於我沒有作弊,我預計不會受到處罰

$0

被車隊解僱的預期成本:100萬美元 * 10% =

-10萬美元

總預期高回報

100萬美元

總預期傻瓜回報

80萬美元

誘惑回報

低迴報

我透過使用興奮劑作弊(我“背叛”)。

我也透過使用興奮劑作弊(我“背叛”)。比賽環境是公平的。

贏得環法腳踏車賽的預期價值(如果我沒有被抓作弊):1000萬美元 * 10% =

100萬美元

比賽一年的預期價值(如果我沒有被抓到):100萬美元 * 10%

10萬美元

作弊的預期處罰(如果我被抓到):500萬美元 * 90% =

-450萬美元

作弊的預期處罰(如果我被抓到):500萬美元 * 90% =

-450萬美元

總預期誘惑回報

-350萬美元

總預期低迴報

-440萬美元

由於賺取100萬美元比損失350萬美元更好,我在情況一中的動機已經改為遵守規則。

我在情況二中的動機也已改為遵守規則。

© .