哥倫比亞大學應用數學副教授克里斯·威金斯提供了以下解釋。
一位病人去看醫生。醫生進行了一項可靠性為 99% 的測試——也就是說,99% 的病人測試結果呈陽性,99% 的健康人測試結果呈陰性。醫生知道,全國只有 1% 的人患病。現在的問題是:如果病人的測試結果呈陽性,那麼病人患病的機率是多少?
直覺上的答案是 99%,但正確答案是 50%,貝葉斯定理給出了我們在這個問題中已知和想知道的事物之間的關係。我們已知的是 p(+|s),數學家會將其讀作“在您生病的情況下測試結果呈陽性的機率”;我們想知道的是 p(s|+) 或“在您測試結果呈陽性的情況下生病的機率”。定理本身讀作 p(s|+) = p(+|s)p(s)/p(+),儘管 1702 年至 1761 年在世的貝葉斯牧師實際上說的是更簡單的東西。貝葉斯陳述了定義關係,將您測試結果呈陽性且生病的機率表示為,在您生病的情況下您測試結果呈陽性的可能性,與您生病的“先驗”機率(即,在指定特定患者和進行測試之前,患者生病的機率)的乘積。
支援科學新聞事業
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞事業 訂閱。透過購買訂閱,您將幫助確保有關塑造我們當今世界的發現和想法的具有影響力的故事的未來。
與其依靠貝葉斯數學來幫助我們解決這個問題,不如考慮另一個例子。假設上述故事發生在一個小國,人口為 10,000 人。從先驗 p(s)=0.01 中,我們知道 1%,即 100 人患病,9,900 人健康。如果我們對每個人進行測試,最有可能的結果是 100 名病人中有 99 名測試結果呈陽性。然而,由於測試有 1% 的錯誤率,因此也有可能 99 名健康人測試結果呈陽性。現在,如果醫生將所有測試結果呈陽性的人送到國家醫院,那裡的健康病人和患病人數將相等。如果您遇到其中一位,即使您掌握了該患者測試結果呈陽性的資訊,這個人患病的機率也只有 50%。
現在想象一下,醫生搬到了另一個國家,進行相同的測試,具有相同的可能性 (p(+|s)),並且對於健康人來說,成功率也相同,我們可以稱之為 p(-|h),“在一個人健康的情況下得分陰性的機率”。然而,在這個國家,我們假設每 200 人中只有一人患病。如果一位新患者測試結果呈陽性,那麼實際上該患者健康的機率高於患病機率。醫生需要更新先驗。(正確的機率留給讀者作為家庭作業。)
定量建模中準確資料的重要性是問題中提出的主題的核心:使用貝葉斯定理來計算上帝存在的機率。對宗教的科學討論是目前的熱門話題,有三本新書反對有神論,其中一本是牛津大學教授理查德·道金斯 (Richard Dawkins) 的著作《上帝的錯覺》(The God Delusion),專門反對使用貝葉斯定理來分配上帝存在的機率。(在撰寫本文時,在 Google 新聞中搜索“Dawkins”會彈出 1,890 條新聞。)使用貝葉斯定理的論點計算了在我們在世界上的經驗(邪惡的存在、宗教經驗等)下上帝的機率,併為這些事實在上帝存在或不存在的情況下的可能性分配了數字,以及對上帝存在的先驗信念——如果我們沒有來自我們經驗的資料,我們將分配給上帝存在的機率。道金斯的論點並非針對貝葉斯定理本身的真實性,其證明是直接且無可辯駁的,而是針對那些使用該公式來論證上帝存在的人缺乏可放入該公式的資料。該等式是完全準確的,但插入的數字,用道金斯的話來說,“不是測量的量,而是 & 個人判斷,為了練習而轉化為數字。”
請注意,儘管這現在受到了很多關注,但量化一個人的判斷以用於貝葉斯計算上帝的存在並非新鮮事。例如,理查德·斯溫伯恩 (Richard Swinburne) 是一位從科學哲學家轉變為宗教哲學家的人(也是道金斯在牛津大學的同事),他在 1979 年估計上帝存在的機率超過 50%,並在 2003 年計算出復活的機率[據推測是耶穌和他的追隨者] “大約為 97%”。(斯溫伯恩為上帝分配了 50% 的先驗機率,因為只有兩種選擇:上帝存在或不存在。另一方面,道金斯認為“人們在某個時候或某個時候相信過無數事物……上帝、飛行麵條怪物、仙女或任何其他事物”,這將相應地降低每個結果的先驗機率。)在回顧貝葉斯定理和神學的歷史時,人們可能會想知道貝葉斯牧師對此有何看法,以及貝葉斯是否將他的定理作為類似論證上帝存在的一部分引入。但這位善良的牧師對此主題隻字未提,他的定理是在他死後作為他對預測給定特定條件下事件機率的解決方案的一部分而引入的。事實上,雖然有很多關於彩票和雙曲對數的資料,但在貝葉斯的“解決機會學說中問題的論文”中,沒有提及上帝,該論文在他去世後於 1763 年提交給了倫敦皇家學會(並且可以在 www.stat.ucla.edu/history/essay.pdf 線上獲取)。
今天,貝葉斯定理的一個主要科學價值在於將模型與資料進行比較,並根據這些資料選擇最佳模型。例如,假設有兩個數學模型 A 和 B,從中可以計算出給定模型 (p(D|A) 和 p(D|B)) 的任何資料的可能性。例如,模型 A 可能是時空為 11 維的模型,模型 B 可能是時空為 26 維的模型。一旦我進行了定量測量並獲得了一些資料 D,就需要計算兩個模型的相對機率:p(A|D)/p(B|D)。請注意,就像將 p(+|s) 與 p(s|+) 相關聯一樣,我可以將此相對機率等同於 p(D|A)p(A)/p(D|B)p(B)。對於某些人來說,這種關係是深刻喜悅的源泉;對於另一些人來說,則是令人發狂的挫敗感。
這種挫敗感的根源是未知的先驗,p(A) 和 p(B)。對數學模型的機率有先驗信念是什麼意思?回答這個問題開啟了“貝葉斯主義者”和“頻率主義者”之間一場痛苦的內部爭鬥,這是一場最好不要捲入的數學幫派戰爭。為了過度簡化,“貝葉斯機率”是對機率的一種解釋,將其視為對假設的置信度;“頻率主義機率”是對機率的一種解釋,將其視為特定結果在大量實驗試驗中出現的頻率。在我們最初的醫生案例中,估計先驗可能意味著更可能和不太可能的預後之間的差異。在模型選擇的情況下,特別是當兩個爭論者持有強烈且截然相反的先驗信念(相信與不相信)時,貝葉斯定理可能會導致比清晰更衝突。
更一般地說,貝葉斯定理用於任何計算“邊際”機率(例如,在示例中測試結果呈陽性的機率 p(+))的計算,該機率來自可能性(例如,在生病或健康的情況下測試結果呈陽性的機率 p(+|s) 和 p(+|h))和先驗機率(p(s) 和 p(h)):p(+) = p(+|s)p(s) + p(+|h)p(h)。這種計算非常普遍,以至於幾乎每個機率或統計學的應用都必須在某個時候呼叫貝葉斯定理。從這個意義上說,貝葉斯定理是遺傳學到谷歌、健康保險到對沖基金等一切事物的核心。它是具體思考不確定性的核心關係,並且——在給定定量資料(可悲的是,這並非總是給定的)的情況下——將數學用作清晰思考世界的工具。