1. 如果懲罰增加到 -9,那麼右上角會給 Alice (4 * 0.9) + ((-9) * 0.1)。右下角會給出 0 的預期收益。由此得出矩陣
¿¿ | Alice 高 | Alice 低 |
Bob 高 | 3, 3 | 0, 2.7 |
Bob 低 | 2.7, 0 | 0, 0 |
在這種情況下,如果 Alice 作弊,無論 Bob 是否作弊,他獲得的收益都相同。因此,從 Bob 的角度來看,右下角和右上角是相同的。如果 Bob 決定不作弊,那麼遊戲狀態將從右上角移動到左上角。為了鼓勵這樣做,你可以使懲罰甚至略微低於 -9(例如,-9.01)。
關於支援科學新聞業
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞業 訂閱。透過購買訂閱,您正在幫助確保未來能夠繼續講述關於塑造我們當今世界的發現和想法的有影響力的故事。
2. 假設懲罰降低到 -5,並且懲罰的機率提高到 17%。那麼,在右下角狀態下,Alice 作弊的預期收益為 (0.83 * 1) + (0.17 * -5) = -0.02。在右上角,預期收益將為 (0.83 * 4) + (0.17 * -5) = 2.47。
¿¿ | Alice 高 | Alice 低 |
Bob 高 | 3, 3 | 0, 2.47 |
Bob 低 | 2.47, 0 | -0.02, -0.02 |
因此,唯一的納什均衡是左上角。
3. 假設有 10% 的可能性被抓住,我們假設懲罰是 -9.01。那麼,右下角的有效值為 (-9.01 * 0.1) + (1 * 0.9) = -0.001。右上角(對於 Alice)的值為 (-9.01 * 0.1) + (4 * 0.9) = 2.699,我們將其近似為 2.7。
這產生了一個博弈矩陣
¿¿ | Alice 高 | Alice 低 |
Bob 高 | 5, 2 | 0, 2.7 |
Bob 低 | 2.7, 0 | -0.001, -0.001 |
因此,Alice 會將遊戲帶到右上角。Bob 可能會抱怨不道德,但 Alice 將這一切都視為一場遊戲。
4. 另一方面,如果懲罰增加到 -17(這可能構成砍掉偷麵包的賊的手),那麼博弈矩陣變為
¿¿ | Alice 高 | Alice 低 |
Bob 高 | 5, 2 | 0, 1.9 |
Bob 低 | 1.9, 0 | -0.8, -0.8 |
唯一的納什均衡是左上角。