對於一名競技腳踏車手來說,沒有什麼比在爬坡時被競爭對手甩掉更讓人身心俱疲、意志消沉的了。肺部灼燒,雙腿痠痛,你身體佝僂在車把上,努力跟上領騎者。你非常清楚,一旦你掉隊,推動自己更努力的動力就會消失——隨之消失的還有獲勝的希望。
我知道這種感覺,因為它在 1985 年的美國橫貫大陸腳踏車賽中發生在我身上,那是在漫長的阿爾伯克基爬坡路段。在城鎮郊外,我追上了排名第二的選手(也是最終的獲勝者)喬納森·博耶,他是一位身材苗條的公路賽車手,也是第一位參加環法腳踏車賽的美國人。在令人腿腳發軟的爬坡路段中途,熟悉的疲憊浪潮席捲我的雙腿,我拼命吸著氧氣,努力堅持下去。
但毫無用處。到達坡頂時,博耶已成為閃閃發光的黑色路面上的一個小點,直到在大西洋城的終點線我才再次見到他。那天晚上晚些時候,美國廣播公司《精彩體育世界》的評論員吉姆·蘭普利問我,為了更快,我還能做些什麼。
支援科學新聞報道
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道: 訂閱。透過購買訂閱,您正在幫助確保未來能夠持續釋出關於塑造我們當今世界的發現和想法的具有影響力的故事。
“我應該選擇更好的父母,”我面無表情地說。我接著說,我們都有某些基因限制,正常的訓練無法克服。我還能做些什麼呢?
有很多,而且我知道。1984 年美國奧運腳踏車隊的腳踏車手告訴我,他們在比賽前如何給自己注射額外的血液,要麼是他們自己的(在賽季早期抽取的),要麼是與他們血型相同的人的血液。“血液興奮劑”,這種做法當時並未被禁止,而且在滑動的道德標尺上,它似乎只比在高海拔地區訓練略有不同。無論哪種方式,你都會增加體內攜帶氧氣的紅細胞數量。不過,我當時已經 30 歲了,而且有一個學術生涯可以依靠。我參加腳踏車比賽主要是為了看看在身體崩潰之前,我能將自己推向多遠。人為地提高我的表現與我參加比賽的原因不太相符。
但假設我 20 歲,靠腳踏車運動謀生,這是我唯一的真正熱情,而且沒有任何其他職業的前景。想象一下,我的團隊已將興奮劑藥物納入其“醫療計劃”,並且我知道如果我沒有競爭力,我可能會被裁掉。最後,假設我相信我的大多數競爭對手都在服用興奮劑,而且那些接受檢測的人幾乎從未被抓到。
實質上,這種情況是許多競技腳踏車手自 20 世紀 90 年代初以來一直面臨的。雖然棒球等其他運動的細節有所不同,但整體興奮劑情況並無太大差異。許多球員確信“其他人都在”服用興奮劑,因此他們開始相信,如果他們不參與,他們就無法保持競爭力。在管理方面,美國職業棒球大聯盟未能明確規則,更不用說在整個賽季中透過廣泛的藥物檢測來執行規則,再加上其歷史上對興奮劑睜一隻眼閉一隻眼的傾向,營造了一個有利於興奮劑的環境。
當然,我們大多數人都不想相信這些傑出的運動員中的任何一位犯有興奮劑罪。但證據的彙集讓我得出結論,在腳踏車運動以及棒球、橄欖球和田徑運動中,過去二十年的大多數頂級競爭者都在使用興奮劑。現在是時候問問原因了,而不是是否。原因有三方面:第一,更好的藥物、藥物混合物和藥物訓練方案;第二,興奮劑服用者始終在與興奮劑檢測者的軍備競賽中獲勝;第三,許多職業運動的轉變已將激勵機制的天平向作弊傾斜,並遠離遵守規則。
博弈體育 博弈論是研究博弈中的玩家如何選擇策略,以在預期其他玩家選擇的策略的情況下最大化其回報的學科。該理論發明的“博弈”不僅包括撲克等賭博遊戲或戰術決策起主要作用的體育比賽;它們還包括人們做出經濟選擇、軍事決策甚至國家外交戰略的致命嚴肅的事務。所有這些“博弈”的共同之處在於,每個玩家的“行動”都根據其他玩家可選擇的範圍進行分析。
囚徒困境博弈是經典示例:你和你的同夥因犯罪被捕,你們被隔離在單獨的牢房中。當然,你們都不想認罪或告發對方,但地方檢察官給了你們每個人以下選擇:
1. 如果你認罪但另一名囚犯不認罪,你將被釋放,而他將被判處三年徒刑。
2. 如果另一名囚犯認罪而你不認罪,你將被判處三年徒刑,而他將被釋放。
3. 如果你們都認罪,你們每人將被判處兩年徒刑。
4. 如果你們都保持沉默,你們每人將被判處一年徒刑。
下表(稱為博弈矩陣)總結了四種結果:
根據這些結果,符合邏輯的選擇是背棄事先協議並背叛你的同夥。為什麼?從第一個囚犯的角度考慮這些選擇。第一個囚犯唯一無法控制的結果是第二個囚犯的選擇。假設第二個囚犯保持沉默。那麼第一個囚犯透過認罪獲得“誘惑”回報(零年徒刑),但透過保持沉默獲得一年徒刑(“高”回報)。在這種情況下,第一個囚犯的更好結果是認罪。但是,假設第二個囚犯認罪。那麼,第一個囚犯再次最好選擇認罪(“低”回報,或兩年徒刑),而不是保持沉默(“冤大頭”回報,或三年徒刑)。由於從第二個囚犯的角度來看,情況與為第一個囚犯描述的情況完全對稱,因此無論另一個囚犯決定做什麼,每個囚犯最好都選擇認罪。
這些偏好不僅是理論上的。當測試物件只玩一次博弈或在不允許溝通的情況下玩固定輪次時,透過認罪來背叛是常見的策略。但是,當測試者在未知輪次內玩博弈時,最常見的策略是以牙還牙:每個人都透過保持沉默開始合作,然後模仿另一個玩家所做的一切。在多人囚徒困境中,如果允許玩家玩足夠長的時間以建立相互信任,則可能會出現更多共同合作。但研究表明,一旦透過認罪來背叛形成勢頭,它就會在整個博弈中級聯。
在腳踏車運動中,就像在棒球和其他運動中一樣,參賽者按照一套規則進行比賽。腳踏車運動規則明確禁止使用興奮劑。但由於興奮劑非常有效,而且其中許多興奮劑難以(如果不是不可能)檢測到,並且由於成功的回報非常大,因此使用違禁物質的動機非常強烈。一旦少數精英車手“背叛”規則(作弊)透過服用興奮劑來獲得優勢,他們遵守規則的競爭對手也必須背叛,從而導致背叛在各個級別蔓延。然而,由於違反規則會受到懲罰,沉默守則阻止了任何關於如何扭轉趨勢並恢復遵守規則的公開交流。
並非一直如此。從 20 世紀 40 年代到 80 年代,許多車手服用興奮劑和止痛藥。但在 1967 年環法腳踏車賽中,英國車手湯姆·辛普森在攀登旺圖山時因服用安非他命而去世後,興奮劑管制實際上不存在。即使在辛普森去世後,20 世紀 70 年代和 80 年代的興奮劑控制也充其量是零星的。由於不清楚什麼是遵守規則,因此很少有人認為服用興奮劑是作弊。然而,在 20 世紀 90 年代,發生了一些事情改變了博弈矩陣。
促紅細胞生成素 (EPO) 合劑
“某事”是基因工程重組人促紅細胞生成素:r-EPO。普通 EPO 是一種天然存在於體內的激素。腎臟將其釋放到血液中,血液將其輸送到骨髓中的受體。當 EPO 分子與這些受體結合時,骨髓會泵出更多紅細胞。慢性腎病和化療會導致貧血,因此 20 世紀 80 年代後期 r-EPO 替代品的開發被證明對慢性貧血患者和長期競爭激烈的運動員都是福音。
服用 r-EPO 與輸血一樣有效,但運動員無需費力處理血袋和必須插入靜脈的長針,而是可以將少量 r-EPO 安瓿瓶放在保溫瓶或酒店迷你冰箱中的冰上,然後只需將激素注射到皮下即可。r-EPO 對競爭者最重要的效果是可以直接測量的:血細胞比容 (HCT) 水平,或血液中紅細胞的體積百分比。更多紅細胞轉化為更多輸送到肌肉的氧氣。對於男性,正常的 HCT 百分比範圍在 40% 左右。訓練有素的耐力運動員可以自然地將他們的 HCT 維持在 40% 幾到 50% 出頭。EPO 可以將這些水平推高到 50% 幾到甚至 60%。1996 年環法腳踏車賽的冠軍比賈尼·里斯被暱稱為 60% 先生;去年他承認,他的非凡 HCT 水平歸功於 r-EPO。
該藥物似乎在 20 世紀 90 年代初進入了職業腳踏車運動。格雷格·萊蒙德認為是 1991 年。萊蒙德曾在 1986 年、1989 年和 1990 年贏得環法腳踏車賽冠軍,他的目標是打破當時的五次環法腳踏車賽冠軍的紀錄,並在 1991 年春季,他準備拿下他的第四個冠軍。“我當時是我有史以來最健康的,我在春季訓練騎行中的分段計時是我職業生涯中最快的,而且我組建了一支圍繞我的強大團隊,”萊蒙德告訴我。“但 1991 年環法腳踏車賽有些不同。以前幾年無法跟上我的車手現在甚至在適度的爬坡中都甩開了我。”
萊蒙德在那屆環法腳踏車賽中獲得第七名,並向自己發誓他可以在第二年乾淨地獲勝。但事與願違。1992 年,他繼續說道,“我們[團隊]的表現非常糟糕,我甚至無法完成比賽。”不服用興奮劑的腳踏車手為了趕上服用興奮劑的競爭對手而精疲力竭。萊蒙德講述了一個他的隊友菲利普·卡薩多當時告訴他的故事。卡薩多從一位名叫勞倫特·賈拉伯特的車手那裡瞭解到,賈拉伯特當時為西班牙 ONCE 腳踏車隊效力,賈拉伯特的個人興奮劑計劃完全由 ONCE 團隊組織。萊蒙德說,該計劃包括 r-EPO,萊蒙德拒絕服用,因此註定他在 1994 年(他的最後一場比賽)再次 DNF(“未完成”)。
一些屈服於服用興奮劑壓力的人付出了更高的代價。例如,卡薩多離開了萊蒙德的團隊,加入了一支有興奮劑計劃的團隊——並在 1995 年突然去世,年僅 30 歲。他的死是否直接由興奮劑引起尚不清楚,但當 HCT 達到 60% 左右及以上時,血液會變得非常粘稠,很容易形成血栓。當睡眠期間心率減慢時,危險尤其高——耐力運動員的靜息心率以每分鐘 30 次左右的低水平而聞名。兩位荷蘭冠軍車手在嘗試 r-EPO 後死於心臟病發作。據報道,一些車手開始睡覺時佩戴心率監測器,該監測器連線到警報器,當他們的脈搏降得太低時會發出聲音。
陷入軍備競賽
正如進化中捕食者和獵物之間存在軍備競賽一樣,在體育運動中,興奮劑服用者和興奮劑檢測者之間也存在軍備競賽。在我看來,檢測者落後服用者五年——而且永遠如此。那些從作弊中獲益最多的人將永遠比那些執行規則的人更具創造力,除非後者具有同等的激勵。1997 年,由於沒有 r-EPO 檢測(直到 2001 年才出現),國際腳踏車聯盟 (UCI)(該運動的管理機構)為男性設定了 50% 的 HCT 限制。此後不久,車手們發現他們可以超過 50%,然後在測試時使用一種已經允許且經常使用的技術來稀釋他們的血液:注射生理鹽水進行補水。瞬間改變。
20 世紀 90 年代 Festina 腳踏車隊的隊醫或全能護理員威利·沃特在他的揭露真相的書《打破鏈條》中解釋了他如何擊敗檢測者:
以防 UCI 醫生早上到達檢查車手的血細胞比容水平,我準備好一切,讓他們透過測試……我帶著生理鹽水滴注液去了車手的房間……整個輸液過程需要二十分鐘,生理鹽水稀釋血液,從而將血細胞比容水平降低三個單位——剛剛好。
這個裝置只需不到兩分鐘即可安裝,這意味著我們可以在 UCI 醫生等待車手從房間下來時將其投入使用。
興奮劑博弈的新規則如何改變了玩家的策略?我直接向喬·帕普提出了這個問題,他是一位 32 歲的職業腳踏車手,目前因合成睪酮檢測呈陽性而被禁賽。在回憶起他被遞交“秘密黑袋子”的那一天時,帕普解釋說,一個道德選擇如何變成一個經濟決策:“當你加入一個有組織的興奮劑計劃的團隊時,你只是被給予藥物和一個選擇:服用它們以跟上進度,或者不服用它們,你很有可能在腳踏車運動中沒有職業生涯。”
當帕普坦白後,職業腳踏車運動界對他處以兩年禁賽。但社會後果遠比這更糟。“這項運動把我吐了出來,”他向我感嘆道。“一個團隊變成了一群兄弟,……但對於一個興奮劑團隊來說,還有一種額外的紐帶——一個共同的秘密——隨之而來的是沉默守則。如果你被抓了,你就閉嘴。當我承認的那一刻,我的朋友們就與我斷絕了關係,因為在他們看來,我讓他們面臨風險。有一個傢伙打電話威脅說,如果我透露他服用興奮劑,他就要殺了我。”
然而,帕普從來都不是環法級別的腳踏車手,因此也許博弈矩陣——及其對車手自身腳踏車職業生涯的影響——在精英級別是不同的。正如我從另一位內部人士那裡瞭解到的那樣,並非如此。“多年來,我毫不費力地完成了我的工作,以幫助車隊領隊,”弗蘭基·安德烈說,他在 20 世紀 90 年代的大部分時間裡都是支援蘭斯·阿姆斯特朗的超級副將或領騎員。“然後,大約在 1996 年,比賽的速度急劇上升。發生了一些事情,而且不僅僅是訓練。”安德烈儘可能長時間地抵制誘惑,但到 1999 年,他再也無法完成他的工作了:“我開始意識到,足夠多的腳踏車手集團[腳踏車比賽中的主要車手群體]都在服用興奮劑,我必須做點什麼。”他開始每週給自己注射兩到三次 r-EPO。“這不像紅牛,它能給你即時能量,”他解釋說。“但這確實能讓你挖得更深一點,堅持在隊伍中更長時間,也許能以每小時 31.5 英里的速度而不是每小時 30 英里的速度行駛。”
興奮劑差異
r-EPO 在像環法腳踏車賽這樣殘酷的三週比賽中的微妙好處之一不僅僅是提高 HCT 水平,而是保持高水平。阿姆斯特朗的前隊友喬納森·沃特斯為我分析了這些數字:“血液興奮劑的最大優勢是能夠在三週內保持 44% 的 HCT。”沃特斯指出,“乾淨”的車手如果開始時 HCT 為 44%,預計在三週的比賽後最終會降至 40%,這是因為自然血液稀釋和紅細胞分解。“僅僅將[你的 HCT 水平]穩定在 44% 就是 10% 的優勢。”
關於興奮劑藥物影響的科學研究數量很少,而且通常是在非運動員或休閒運動員身上進行的,但它們與沃特斯的評估一致。(出於顯而易見的原因,服用興奮劑的精英運動員不願透露他們的資料。)我採訪過的運動生理學家之間的共識是,r-EPO 至少能提高 5% 到 10% 的表現。當它與其他藥物混合在一起時,還可以從人體引擎中擠出另外 5% 到 10% 的提升。在差異小於 1% 的賽事中,這種優勢是巨大的。
義大利運動生理學家米歇爾·法拉利對興奮劑的瞭解非常豐富,但也備受爭議(因為他與興奮劑檢測呈陽性或被指控服用興奮劑的精英運動員關係密切),他這樣解釋道:“如果[紅細胞]的體積增加 10%,表現[車手有用動能輸出的淨收益]將提高約 5%。這意味著在計時賽中以每小時 50 公里的速度騎行的腳踏車手每公里可縮短約 1.5 秒的時間,或者在坡度高達 10% 的坡道上以每小時 10 公里的速度爬坡的腳踏車手每公里可縮短約 8 秒的時間。”
在環法腳踏車賽中,這些數字意味著 HCT 提高 10% 的腳踏車手將在 50 公里(31 英里)計時賽中將自己的時間縮短 75 秒,而計時賽通常以幾秒之差決定勝負。在阿爾卑斯山和比利牛斯山脈的任何眾多 10 公里(6 英里)爬坡路段中,在坡度高達 10% 的坡道上,同樣的血液差異將為車手在每次爬坡中贏得驚人的 80 秒。如果任何頂級腳踏車手都在服用興奮劑,那麼他們昔日的競爭對手就無法承受放棄如此大的優勢。這就是博弈矩陣進入背叛模式的地方。
納什均衡
在博弈論中,如果任何玩家都沒有透過單方面改變策略而獲得任何收益,則稱該博弈處於納什均衡狀態。這個概念是由數學家小約翰·福布斯·納什提出的,他在電影《美麗心靈》中被刻畫出來。為了結束體育運動中的興奮劑,必須重組興奮劑博弈,以便乾淨地競爭處於納什均衡狀態。也就是說,每項運動的管理機構都必須改變博弈矩陣中確定的預期結果的收益值。首先,當其他玩家都遵守規則時,遵守規則的回報必須大於作弊的回報。其次,也許更重要的是,即使其他玩家都在作弊,公平競爭的回報也必須大於作弊的回報。玩家絕不能覺得自己因遵守規則而成了冤大頭。
在囚徒困境博弈中,降低認罪的誘惑,並在另一名囚犯認罪的情況下提高保持沉默的回報,可以增加合作。在玩家玩博弈之前讓他們有機會溝通是增加他們合作的最有效方法。在體育運動中,這意味著打破沉默守則。每個人都必須承認存在需要解決的問題。然後必須進行藥物檢測,並將結果定期透明地傳達給所有人,直到檢測結果乾淨為止。這將向每個玩家表明,無論其他玩家做什麼,公平競爭的回報都大於作弊的回報。
以下是我關於腳踏車運動(和其他運動)如何達到納什均衡的建議,在這種均衡狀態下,沒有人有任何動機透過服用興奮劑來作弊:
1. 對所有運動員過去(2008 年之前)的作弊行為給予豁免。由於整個系統都已腐敗,而且大多數競爭者都在服用興奮劑,因此在事後剝奪冠軍頭銜沒有任何意義,因為幾乎可以肯定,亞軍也在服用興奮劑。有了豁免權,退役運動員可能會幫助改進反興奮劑系統。
2. 增加接受檢測的競爭者的數量——比賽期間、比賽外,尤其是比賽前後立即進行檢測——以挫敗對策。檢測應由不隸屬於任何制裁機構、車手、贊助商或團隊的獨立藥物機構進行。團隊還應聘請獨立的藥物檢測公司來檢測自己的車手,首先對每位運動員進行季前賽表現測試,以建立基線概況。企業贊助商應提供額外的財政支援,以確保檢測的嚴格性。
3. 建立一項獎勵,以 X 大獎(為各種技術成就提供的現金獎勵)為藍本,獎勵科學家開發能夠檢測目前無法檢測到的興奮劑的檢測方法。藥物檢測者的激勵必須等於或大於藥物服用者的激勵。
4. 大幅提高被抓到的處罰:一次罷工,終身禁賽。為了保護運動員免受誤報結果或不稱職的藥物檢測人員(兩者都存在)的侵害,仲裁和申訴制度必須公平且值得信賴。但是,一旦做出決定,就必須具有實質性和最終性。
5. 如果團隊中的任何成員興奮劑檢測呈陽性,則取消該團隊所有成員參加比賽的資格。強制被判有罪的運動員將所有已支付的薪金和獲得的獎金返還給團隊贊助商。這種處罰的威脅將對所有團隊成員施加“兄弟情誼”心理的巨大社會壓力,從而為他們提供強大的動力來執行自己的反興奮劑規則。
這聽起來可能像烏托邦。但這可以奏效。沃特斯現在是美國 Slipstream/Chipotle 腳踏車隊的經理,他已經啟動了一項廣泛而定期的內部藥物檢測計劃。“請記住,這些傢伙大多數是運動員,而不是罪犯,”他說。“如果他們相信其他人都在停止[服用興奮劑],並且在腳踏車手集團的速度中感受到這一點,他們也會停止,並大大鬆一口氣。”
希望永存。但我相信,透過這些改變,博弈的心理可以從背叛轉變為合作。如果是這樣,體育運動就可以迴歸到獎勵和慶祝卓越表現的傳統,而卓越表現的提升僅僅來自於運動員的求勝意志。
更多探索: 打破鏈條:藥物與腳踏車運動:真實故事。 威利·沃特。蘭登書屋英國,2002 年。
行為博弈論:戰略互動實驗。 科林·F·卡梅勒。普林斯頓大學出版社,2003 年。
從蘭斯到蘭迪斯:環法腳踏車賽美國興奮劑爭議內幕。 大衛·沃爾什。巴蘭坦圖書,2007 年。
艱難的旅程:與職業腳踏車手一起在車輪後。 保羅·金梅奇。蘭登書屋英國,2007 年。
環法腳踏車賽:文化史。 克里斯托弗·S·湯普森。加利福尼亞大學出版社,2008 年。