生活充滿了不確定性。我們沒有人知道將會發生什麼。對於過去發生的事情,或者現在在我們直接經驗之外正在發生的事情,我們知之甚少。不確定性被稱為“對無知的有意識的覺察”——無論是明天的天氣、下一屆英超冠軍、2100年的氣候,還是我們遠古祖先的身份。
在日常生活中,我們通常用語言表達不確定性,說一個事件“可能”、“也許”或“很可能”會發生(或已經發生)。但是不確定的詞語可能是靠不住的。1961年,新當選的美國總統約翰·F·肯尼迪被告知一項中央情報局資助的入侵共產主義古巴的計劃時,他委託他的軍事高階將領進行評估。他們的結論是,這項任務有30%的成功機會——也就是說,有70%的失敗機會。在提交給總統的報告中,這被表述為“機會尚可”。豬灣入侵按計劃進行,結果卻是一場慘敗。現在已經有成熟的量表可以將不確定性的詞語轉換為粗略的數字。例如,英國情報界任何使用“很可能”一詞的人,都應該意味著機會在55%到75%之間(參見go.nature.com/3vhu5zc)。
試圖用數字來衡量機會和不確定性,將我們帶入了機率的數學領域,今天機率被自信地應用於許多領域。例如,開啟任何科學期刊,你會發現論文中 liberally sprinkled with P 值、置信區間,可能還有貝葉斯後驗分佈,所有這些都依賴於機率。
支援科學新聞
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保有關塑造我們今天世界的發現和想法的具有影響力的故事的未來。
然而,我將論證,任何數值機率——無論是在科學論文中,還是作為天氣預報的一部分,預測體育比賽的結果,或量化健康風險——都不是世界的客觀屬性,而是一種基於個人或集體判斷以及(通常是可疑的)假設的構建。此外,在大多數情況下,它甚至不是在估計某些潛在的“真實”量。實際上,機率很少能說是“存在”的。
偶然闖入者
機率是數學領域相對較晚的來者。儘管人們使用 astragali(踝骨)和骰子賭博已經有數千年的歷史,但直到17世紀50年代法國數學家布萊茲·帕斯卡和皮埃爾·德·費馬開始通訊,才對“偶然”事件進行了嚴格的分析。就像從蓄勢待發的堤壩中釋放出來一樣,機率從此湧入金融、天文學和法律等各個領域——更不用說賭博了。
為了掌握機率的滑溜性,請考慮現代天氣預報中如何使用這個概念。氣象學家會預測溫度、風速和降雨量,通常還會預測降雨機率——例如,在給定的時間和地點降雨機率為70%。前三項可以與其“真實”值進行比較;你可以出去測量它們。但是沒有“真實”的機率可以與預報員的評估進行比較。沒有“機率計”。要麼下雨,要麼不下雨。
更重要的是,正如哲學家伊恩·哈金強調的那樣,機率是“ Janus-faced ”:它既處理機會,也處理無知。想象一下我拋一枚硬幣,問你它正面朝上的機率是多少。你欣然地說“50-50”,或“一半”,或其他變體。然後我拋了硬幣,快速偷看了一下,但把它蓋住了,然後問:你現在認為它是正面的機率是多少?
請注意,我說的是“你的”機率,而不是“這個”機率。大多數人現在猶豫不決地給出答案,然後勉強重複“50-50”。但是事件已經發生了,不再有隨機性了——只有你的無知。情況已經從關於我們無法知道的未來的“偶然性”不確定性,轉變為關於我們目前不知道的“認知性”不確定性。數值機率用於這兩種情況。
這裡還有另一個教訓。即使對於應該發生的事情有一個統計模型,這也總是基於主觀假設——在拋硬幣的情況下,假設有兩個同樣可能的結果。為了向聽眾演示這一點,我有時會使用一枚兩面都是正面的硬幣,表明即使他們最初“50-50”的意見也是基於對我的信任。這可能很草率。
主觀性和科學
我的論點是,任何機率的實際應用都涉及主觀判斷。這並不意味著我可以隨意對我自己的想法加上數字——如果我聲稱有99.9%的把握我可以從屋頂上飛下來,我就會被證明是一個糟糕的機率評估者。當機率及其基本假設與現實進行檢驗時,客觀世界就會發揮作用(參見“我有多無知?”);但這並不意味著機率本身是客觀的。
人們用來評估機率的一些假設將比其他假設具有更強的理由。如果我在拋擲硬幣之前仔細檢查過它,並且它落在堅硬的表面上並混亂地彈跳,那麼我會比某個可疑的人掏出一枚硬幣並隨意翻轉幾下,更覺得我的 50-50 判斷是合理的。但是,這些相同的限制適用於任何使用機率的地方——包括在科學背景下,在科學背景下,我們可能更容易相信其所謂的客觀性。
這是一個真正的科學和公共重要性的例子。在 COVID-19 大流行開始後不久,RECOVERY 試驗開始在英國住院患者中測試療法。在一項實驗中,超過 6,000 人被隨機分配接受他們在醫院接受的標準護理,或該護理加上地塞米松(一種廉價的類固醇)的劑量。在那些接受機械通氣的患者中,與僅接受標準護理的組相比,分配到地塞米松組的年齡調整後的每日死亡風險降低了 29%(95% 置信區間為 19-49%)。P 值——在假設風險沒有潛在差異的零假設下,觀察到如此極端相對風險的計算機率——可以計算為 0.0001,即 0.01%。
這都是標準分析。但是,精確的置信水平和 P 值不僅僅依賴於假設零假設。它還取決於統計模型中的所有假設,例如觀測值是獨立的:即,沒有因素導致在空間和時間上更密切接受治療的人具有更相似的結果。但是,存在許多此類因素,無論是人們接受治療的醫院還是不斷變化的護理方案。精確值還取決於每個組中的所有參與者都具有相同的潛在 28 天生存機率。這會因各種原因而異。
這些錯誤的假設都不一定意味著分析存在缺陷。在這種情況下,訊號非常強烈,以至於允許潛在風險在參與者之間變化的模型對總體結論幾乎沒有影響。但是,如果結果更邊緣化,則應適當對模型對替代假設的敏感性進行廣泛分析。
為了實踐廣為引用的格言,“所有模型都是錯誤的,但有些是有用的”。地塞米松分析特別有用,因為其堅定的結論改變了臨床實踐,並挽救了數十萬人的生命。但是,結論所依據的機率不是“真實的”——它們是主觀的,如果合理的話,假設和判斷的產物。
深入兔子洞
那麼,這些數字是我們對某些潛在“真實”機率(世界的客觀特徵)的主觀的、可能存在缺陷的估計嗎?
我在此處補充說明,我不是在談論量子世界。在亞原子層面,數學表明,無因事件可能以固定的機率發生(儘管至少有一種解釋表明,即使是這些機率也表達了與其他物體或觀察者的關係,而不是量子物體固有的屬性)。但同樣,似乎這對宏觀世界中日常可觀察到的事件幾乎沒有影響。
我還可以避免關於非量子世界本質上是否是確定性的,以及我們是否擁有自由意志來影響事件程序的幾個世紀以來的爭論。無論答案如何,我們仍然需要定義客觀機率實際上是什麼。
多年來,人們已經做出了許多嘗試來做到這一點,但它們似乎要麼有缺陷,要麼有限。其中包括頻率主義機率,這種方法定義了在本質上相同的無限多次重複情況下會看到的事件的理論比例——例如,在相同人群和相同條件下一次又一次地重複相同的臨床試驗,就像《土撥鼠日》一樣。這似乎相當不現實。英國統計學家羅納德·費舍爾建議將唯一的資料集視為來自假設無限總體的樣本,但這似乎更像是一個思想實驗,而不是客觀現實。或者,還有傾向的半神秘思想,即在特定背景下,例如我在未來十年內心臟病發作,存在特定事件發生的某種真實潛在趨勢。這似乎實際上無法驗證。
在有限範圍的良好控制、可重複的情況下,複雜性如此之高,以至於即使它們本質上是確定性的,也透過在長期內具有可預測屬性的機率分佈來符合頻率主義正規化。這些包括標準隨機化裝置,例如輪盤賭輪、洗過的撲克牌、旋轉的硬幣、擲骰子和彩票球,以及偽隨機數生成器,它們依賴於非線性、混沌演算法來給出透過隨機性測試的數字。
在自然界中,我們可以加入大量氣體分子的運作,即使它們遵循牛頓物理學,也服從統計力學的定律;以及遺傳學,其中染色體選擇和重組的巨大複雜性產生了穩定的遺傳率。在這些有限的情況下,假設偽客觀機率——“這個”機率,而不是“一個”(主觀)機率可能是合理的。
然而,在其他所有使用機率的情況下——從廣泛的科學領域到體育、經濟學、天氣、氣候、風險分析、災難模型等等——將我們的判斷視為對“真實”機率的估計是沒有意義的。這些只是我們可以嘗試根據我們的知識和判斷,用機率來表達我們個人或集體的不確定性的情況。
判斷事項
這一切只會引發更多問題。我們如何定義主觀機率?如果機率定律基於我們基本上編造的東西,為什麼它們是合理的?這在學術文獻中已經討論了近一個世紀,同樣沒有普遍認可的結果。
最早的嘗試之一是由英國劍橋大學的數學家弗蘭克·拉姆齊在 1926 年做出的。他是我歷史上最想見到的人。他是一位天才,他在機率、數學和經濟學方面的工作至今仍被認為是基礎性的。他只在上午工作,將下班後的時間獻給妻子和情人,打網球,喝酒,參加熱鬧的派對,同時“像河馬一樣”大笑(他是個大塊頭,體重達 108 公斤)。他於 1930 年去世,年僅 26 歲,據他的傳記作者謝麗爾·米薩克說,可能是因為在劍河游泳後感染了鉤端螺旋體病。
拉姆齊表明,所有的機率定律都可以從對特定賭博的表達偏好中推匯出來。結果被賦予效用,而賭博某事的價值由其預期效用概括,預期效用本身受表達部分信念的主觀數字支配——即,我們的個人機率。然而,這種解釋確實需要對這些效用值進行額外規範。最近,研究表明,機率定律可以透過簡單地以最大化您在使用適當評分規則時的預期表現的方式行事來推匯出來,例如測驗“我有多無知?”中所示的評分規則。
嘗試定義機率通常相當模稜兩可。例如,艾倫·圖靈在他的 1941-2 年的論文《機率在密碼學中的應用》中,使用了工作定義,即“在某些證據下,事件發生的機率是在給定證據的情況下,該事件可能發生的案例比例”。這承認實際機率將基於期望——人類判斷。但是,圖靈所說的“案例”是指相同觀察的例項,還是相同判斷的例項?
後者與客觀機率的頻率主義定義有一些共同之處,只是重複的相似觀察類別被重複的相似主觀判斷類別所取代。在這種觀點中,如果降雨機率被判斷為 70%,則將其置於預報員分配 70% 機率的場合集合中。事件本身預計在 70% 的此類場合中發生。這可能是我最喜歡的定義。但是,機率的模糊性得到了鮮明的證明,因為在將近四個世紀之後,仍然有許多人不會同意我的觀點。
實用方法
當我在 1970 年代還是學生時,我的導師、統計學家 Adrian Smith 正在翻譯義大利精算師布魯諾·德·菲內蒂的《機率論》。德·菲內蒂與拉姆齊大約在同一時間,但完全獨立地發展了主觀機率的思想。(他們的性格截然不同:與拉姆齊堅定的社會主義相反,德·菲內蒂年輕時是義大利獨裁者貝尼託·墨索里尼風格的法西斯主義的熱情支持者,儘管他後來改變了主意。)那本書以挑釁性的宣告開頭:“機率不存在”,這個想法在過去 50 年中對我的思想產生了深刻的影響。
然而,在實踐中,我們或許不必決定客觀的“機會”是否真的存在於日常的非量子世界中。相反,我們可以採取務實的方法。頗具諷刺意味的是,德·菲內蒂本人在他 1931 年關於“可交換性”的工作中為這種方法提供了最有說服力的論據,這項工作產生了一個以他的名字命名的著名定理。如果我們對每個序列的主觀機率不受我們的觀察順序的影響,則一系列事件被判斷為可交換的。德·菲內蒂出色地證明,這個假設在數學上等同於假設事件是獨立的,每個事件都具有一些真實的潛在“機會”發生,並且我們對未知機會的不確定性透過主觀的、認知的機率分佈來表達。這非常了不起:它表明,從特定但純粹主觀的信念表達開始,我們應該表現得好像事件是由客觀機會驅動的。
令人驚歎的是,如此重要的工作體系,是所有統計科學和許多其他科學和經濟活動的基礎,竟然來自如此難以捉摸的想法。因此,我將用我自己的格言來總結。在我們的日常世界中,機率可能並不存在——但像它存在一樣行動通常是有用的。
本文經許可轉載,最初於 2024 年 12 月 16 日首次發表。
