瞭解你的機率:健康統計資料的真正意義

瞭解如何拋開不必要的恐懼和希望,以及如何權衡你患病的真實風險——或康復的可能性

在2007年的一次競選廣告中,紐約市前市長魯迪·朱利安尼說:“五六年前我得了前列腺癌。我在美國患前列腺癌的存活率是多少?百分之八十二。我在英國患前列腺癌的存活率是多少?在社會化醫療體制下只有百分之四十四。” 朱利安尼用這些統計資料來論證他很幸運住在紐約而不是約克。這一宣告成了大新聞。正如我們將要解釋的那樣,這也是一個大錯誤。

1938年,在《世界大腦》(Methuen & Co. 出版)一書中,英國作家 H. G. 威爾斯預言,對於現代民主社會中受過教育的公民來說,統計思維將像讀寫能力一樣不可或缺。在 21 世紀初,幾乎每個生活在工業社會的人都接受過讀寫教育,但沒有接受過統計思維教育——即如何理解我們技術世界中關於風險和不確定性的資訊。許多醫生、記者和像朱利安尼這樣的政治家也缺乏這種理解,結果導致他們向公眾傳播誤解。

統計文盲並非根植於內在的智力缺陷——例如,缺乏“數學基因”——而是根植於社會和情感力量。這些影響包括醫患關係中的家長式作風、醫學中確定性的錯覺,以及以晦澀難懂的形式呈現健康資訊的做法,這些形式錯誤地暗示了干預措施的巨大益處和微小危害。當公民不理解這些數字時,他們很容易受到政治和商業對其焦慮和希望的操縱。其結果可能會對身心健康造成嚴重損害。


關於支援科學新聞報道

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保未來能夠繼續看到有關塑造我們當今世界的發現和思想的有影響力的報道。


我們將向您展示如何識別醫學中三種類型的統計操縱和混淆,如何將晦澀難懂的數字轉化為有意義的數字,以及如何使用這些資訊做出更好的醫療決策。為了從一開始就避免此類誤解,我們認為醫學期刊、媒體和其他機構應該以更容易理解的形式傳播風險資訊。此外,我們建議從小培養兒童的統計思維,並將統計學作為解決實際問題的一種方式來教授,而不是作為一門純粹的數學學科。

信任你的醫生?
醫學長期以來一直對統計學抱有敵意。幾個世紀以來,治療都是基於個人信任的倫理,而不是定量的、被認為是非個人的或與個人無關的事實。即使在今天,許多醫生仍然認為自己是藝術家,更多地依賴直覺和對自己判斷的信心,而不是數字。就患者而言,許多人寧願信任醫生,甚至不願意要求提供資料進行分析。例如,在我們中的一位(Gigerenzer)及其同事在 2008 年進行的一項未發表的調查中,超過三分之二的 100 多位美國經濟學家表示,他們沒有權衡進行前列腺癌篩查的任何利弊,而只是遵循了醫生的建議。

此外,個人常常回避統計資料,因為他們對確定性有一種情感需求——這與統計素養的概念背道而馳,統計素養讓我們能夠在面對不確定性時做出決策。Gigerenzer 在 2006 年進行的一項調查表明,公眾對癌症和 HIV 等檢測的可靠性抱有虛幻的確定性。

此外,統計學知識不足的患者及其醫生往往會極大地高估篩查檢測的益處,而對它們的危害視而不見。例如,乳房 X 線照片將 50 多歲女性死於乳腺癌的風險從大約 13 年內的 1/1000 降低到 4/1000,但美國隨機抽樣的女性中有 60% 認為益處高出 80 倍。美國人對全身計算機斷層掃描 (CT) 也同樣過於熱情:在 500 名美國人的隨機樣本中,近四分之三的人表示,他們寧願選擇免費的全身 CT 掃描,也不願選擇 1,000 美元現金。然而,沒有一家專業醫療機構認可此類掃描,一些機構甚至不鼓勵這樣做,因為此類篩查檢測可能會因模糊的發現而引發一系列醫療難題和侵入性治療,從而造成重大危害。

現代技術社會中的公民面臨著一系列令人眼花繚亂的醫療決策。35 歲的孕婦是否應該進行染色體異常的產前篩查?父母是否應該送他們的少女去接種人乳頭瘤病毒疫苗,以保護她們免受宮頸癌的侵害,儘管有一些報告稱該疫苗 (Gardasil) 可能會導致癱瘓?如果人們想做出明智的決定,他們需要理解健康統計資料。特別是,他們需要理解絕對風險和相對風險之間的區別,以及如何使用自然頻率從陽性檢測結果中推斷出疾病的真實機率。在評估針對健康人群的篩查檢測時,個人也應該知道要信任死亡率而不是五年生存率統計資料。我們將依次處理這些問題。

絕對風險
1995 年 10 月,英國藥品安全委員會警告說,第三代口服避孕藥會使腿部或肺部可能危及生命的血栓的可能性增加一倍——即增加 100%。這一資訊透過“致醫生函”傳遞給 190,000 名全科醫生、藥劑師和公共衛生主管,並在向媒體釋出的緊急公告中釋出。這一訊息引起了極大的焦慮,婦女停止服用避孕藥,導致英格蘭和威爾士在接下來的一年中估計增加了 13,000 例墮胎。每增加一次墮胎,就會額外增加一次生育,其中包括 16 歲以下女孩的約 800 例額外懷孕。(具有諷刺意味的是,墮胎和懷孕與血栓形成的風險增加有關,而這種風險超過了第三代避孕藥的風險。)

如果以更直接的方式報告資料,就可以避免這種恐慌。證據表明,每 7,000 名服用第二代避孕藥的婦女中,約有 1 人出現血栓;在服用第三代避孕藥的婦女中,這一數字增加到 7,000 人中的 2 人。也就是說,即使相對風險增加確實為 100%,絕對風險增加也僅為 1/7,000。絕對風險通常是小數字,而相應的相對變化往往看起來很大——尤其是在基線率較低時。

報告相對風險可能會產生不切實際的希望以及不必要的焦慮。如果以相對風險降低的形式表達益處,許多患者和醫生會更積極地評估治療或檢測。例如,在 2007 年對實驗研究的回顧中,英國杜倫大學的心理學家朱迪思·科維發現,當以相對風險降低的形式呈現藥物的益處時,91% 的丹麥全科醫生會向患者推薦該藥物。但是,當給出絕對風險降低時,只有 63% 的人會推薦同一種藥物。

資訊手冊、醫生、醫學期刊和媒體繼續以相對變化的形式告知公眾,部分原因是大的數字更能成為頭條新聞並引起更多關注。一份宣傳單甚至將兩者混為一談,聲稱激素替代療法 (HRT)“已被證明可以保護女性免受結直腸癌的侵害(高達 50% 以上)”,而乳腺癌的風險“可能會增加 0.6%(千分之六)”。資料顯示,50% 的益處對應於一個小於千分之六的絕對數字——這意味著 HRT 產生的癌症病例多於它預防的病例。但是,根據 2003 年的一項研究,80 名女性中有 60 名從宣傳單中得出了完全相反的結論。

絕對風險更具資訊量,因為它們考慮了有關背景發生率的資訊。給定絕對風險,一個人可以推匯出相對風險——但反之則不然。畢竟,50% 的相對風險降低可能描述的是 10,000 名患者中死亡人數從 200 人大幅減少到 100 人,也可能描述的是 10,000 名患者中死亡人數從 2 人小幅減少到 1 人。隨機試驗提供了醫學中一些最好的資訊,但除非充分報告結果,否則人們將無法評估它們。

自然頻率
假設一位女性剛剛收到乳房 X 線照片的陽性結果,並詢問她的醫生:我確定得了乳腺癌嗎?或者我得這種病的機率有多大?在 2007 年面向婦科醫生的繼續教育課程中,Gigerenzer 要求 160 位從業者根據以下關於該地區女性的資訊回答這個問題

  • 女性患乳腺癌的機率(患病率)為 1%。

  • 如果女性患有乳腺癌,則她檢測呈陽性(敏感性)的機率為 90%。

  • 如果女性沒有患乳腺癌,則她仍然檢測呈陽性(假陽性率)的機率為 9%。

對患者的詢問的最佳答案是什麼?

  1. 她患乳腺癌的機率約為 81%。

  2. 在 10 位乳房 X 線照片呈陽性的女性中,約有 9 位患有乳腺癌。

  3. 在 10 位乳房 X 線照片呈陽性的女性中,約有 1 位患有乳腺癌。

  4. 她患乳腺癌的機率約為 1%。

婦科醫生可以從上面的統計資料中推匯出答案,或者他們可以簡單地回憶起他們無論如何都應該知道的東西。無論哪種情況,最佳答案都是選項 3;在篩查中檢測呈陽性的每 10 位女性中,只有大約 1 位實際上患有乳腺癌。其他 9 位是虛驚一場。在接受培訓之前,大多數(60%)婦科醫生回答 90% 或 81%,從而嚴重高估了患癌症的機率。只有 21% 的醫生選擇了最佳答案——十分之一。

如果圍繞檢測的統計資料以自然頻率呈現,醫生將更容易推匯出正確的機率。例如

  • 每 1,000 名女性中,有 10 名患有乳腺癌。

  • 在這 10 位患有乳腺癌的女性中,有 9 位檢測呈陽性。

  • 在 990 位未患癌症的女性中,約有 89 位仍然檢測呈陽性。

因此,98 位女性檢測呈陽性,但其中只有 9 位實際上患有該疾病。在學習將條件機率轉化為自然頻率後,87% 的婦科醫生理解十分之一是最佳答案。同樣,英國利物浦大學的心理學家羅斯·布拉姆韋爾及其同事在 2006 年報告說,在 21 位產科醫生中,只有 1 位能夠正確估計出給定陽性檢測結果的未出生兒童實際患有唐氏綜合徵的機率。當他們獲得相關的自然頻率時,20 位產科醫生中有 13 位得出了正確答案。

醫生需要告知患者,沒有完美的檢測,每個檢測結果都需要謹慎解釋,或者需要重複檢測。每位接受乳房 X 線照片檢查的女性都應該被告知,許多可疑結果都是虛驚一場。所有此類檢測,甚至 HIV 檢測,都存在類似的不確定性。在 1987 年的一次艾滋病會議上,時任佛羅里達州參議員勞頓·柴爾斯報告說,在佛羅里達州被告知 HIV 檢測呈陽性的 22 位獻血者中,有 7 位自殺身亡。儘管 HIV 檢測可以檢測出 99.9% 的真陽性感染,並且 99.99% 的陰性結果是準確的,但在低風險異性戀男性中,非常低的基線率意味著當男性在篩查中檢測呈陽性時,感染的機率可能低至 50% [參見上面的方框]。 (但是,當基線率較高時,例如,在有無保護性行為的同性戀男性或共用針頭的靜脈吸毒者中,HIV 檢測陽性結果的真陽性感染機率幾乎是肯定的。因此,人群中的基線率決定了陽性檢測結果的含義。)

死亡率很重要
在競選總統期間,朱利安尼聲稱美國的醫療保健優於英國。他顯然使用了 2000 年的資料,當時每 10 萬名英國男性中有 49 人被診斷出患有前列腺癌,其中 28 人在五年內死亡——約佔 44%。他使用了類似的方法,引用了美國相應的 82% 的五年生存率,表明美國前列腺癌患者的生存可能性是英國同行的兩倍。然而,這種暗示是錯誤的,因為這些生存統計資料在很大程度上反映了兩國之間的診斷差異,而不是美國更好的治療和延長的生存期。

要理解為什麼,請想象一組在英國 67 歲時(根據他們的症狀)被診斷出患有前列腺癌的患者,他們都在 70 歲時去世。每個人只存活了三年,因此該組的五年生存率為 0%。現在想象一下,同一組人在美國被診斷出來,美國的醫生透過前列腺特異性抗原 (PSA) 篩查來檢測大多數前列腺癌。(PSA 檢測在英國不常用。)這些美國患者的診斷時間較早,為 60 歲,但他們仍然都在 70 歲時去世。所有人現在都存活了 10 年,因此他們的五年生存率為 100%。即使生存率發生了巨大變化,死亡時間也沒有改變。這個例子表明,即使沒有延長或挽救生命,提前診斷時間如何能夠提高生存率(提前期偏倚)。

虛假的生存率升高也可能來自過度診斷,即檢測到技術上是癌症但永遠不會發展到在患者一生中引起症狀的異常情況。假設 1,000 名患有進展性癌症的男性未接受篩查。五年後,仍有 440 人活著,導致生存率為 44%。與此同時,在另一組男性中,PSA 篩查檢測到 1,000 名患有進展性癌症的人和 2,000 名患有非進展性癌症的人(根據定義,他們不會在五年內死於癌症)。現在,這些非進展性病例被新增到 440 名存活的進展性癌症患者中,從而將生存率誇大到 81%。儘管生存率發生了巨大變化,但死亡人數根本沒有改變。

在美國,在 1980 年代後期使用 PSA 檢測進行前列腺癌篩查導致新的前列腺癌診斷數量激增。在英國,由於 PSA 檢測的使用量要少得多,因此影響要小得多。這種診斷差異在很大程度上解釋了為什麼美國前列腺癌的五年生存率更高。(最新的數字是美國五年生存率為 98%,而英國為 71%。)

儘管生存率存在差異,但兩國的死亡率卻相近:美國男性前列腺癌死亡人數約為每 10 萬人 26 人,而英國為每 10 萬人 27 人。這一事實表明,PSA 檢測不必要地標記了許多美國男性的前列腺癌,導致了大量不必要的手術和放射治療,而這些治療通常會導致陽痿或失禁。

由於過度診斷和提前期偏倚,當診斷模式不同時,五年生存率的變化與死亡率的變化沒有可靠的關係。然而,許多官方機構仍在談論五年生存率。英國國家統計局最近的一份報告指出,美國的結腸癌五年生存率為 60%,而英國為 35%。專家將這一發現稱為“可恥”,並呼籲將政府在癌症治療方面的支出增加一倍。事實上,英國結腸癌的死亡率與美國大致相同。在一個更奇怪的案例中,著名的德克薩斯大學 MD 安德森癌症中心的廣告將生存率與死亡率混為一談:“隨著 1960 年至 1990 年間全國前列腺癌死亡率的波動,MD 安德森患者的前列腺癌五年生存率持續提高”(重點已新增)。

與五年生存率相比,死亡率是衡量篩查專案價值的更可靠指標,五年生存率因早期診斷和過度診斷而提高了生存率。那麼,男性應該接受 PSA 檢測還是吸菸者應該接受 CT 掃描以篩查肺癌?這兩種檢查都可以發現更多早期癌症——但都沒有被證明可以降低死亡率。

人們通常認為篩查是保障他們健康的措施,即使疾病很少見。但是,額外的檢測可能會導致不必要的醫療干預,從而可能造成傷害,這意味著這種策略絕非“安全”。對於許多過度診斷的患者來說,治療只能造成傷害。診斷的流行可能像疾病一樣危害我們的健康。

解決問題
如果研究人員、醫生和媒體使用直接的數字而不是令人困惑的數字,統計誤解就會少得多:絕對風險而不是相對風險,自然頻率而不是條件機率,死亡率而不是五年生存率。除了改變健康統計資料的報告方式外,我們還需要更好地教育我們的年輕人瞭解風險科學。

如今,美國的數學課程以確定性數學為中心——從算術到微積分——而機率和統計學的教學出現得太晚了。正如 H. G. 威爾斯所建議的那樣,統計學應該像讀寫一樣儘早教授。事實上,美國全國數學教師委員會多年來一直在推動教育工作者在小學階段開始統計學和機率的教學。如果孩子們學會以有趣的方式應對不確定的世界,那麼大部分集體統計文盲現象將成為歷史。

此外,教師需要以不同的方式對待統計學。教師不應該教學生如何將公式應用於涉及紙牌和骰子的玩具問題,而應該向他們展示如何使用數字來解決現實世界中的困境。甚至可以將統計學從數學教育工作者手中奪走,建立一個與學校健康教學相關的解決問題領域。這樣一個新領域可能有助於年輕人就藥物、酒精使用、駕駛、生物技術和其他相關的健康問題做出更好的決定。

在一個關於這種方法的出色示例中,一本中學教科書講述了一個真實的故事,一個 26 歲的單身母親在一次常規 HIV 檢測中呈陽性,失去了工作,搬進了一家與其他 HIV 陽性居民合住的中途宿舍,與其中一位發生了無保護性行為,最終患上了支氣管炎,她的新醫生要求她再次進行 HIV 檢測。她做了,結果是陰性,她的原始血樣在重新檢測時也是陰性。這位婦女經歷了一場噩夢,因為她的醫生沒有意識到陽性檢測結果不是最終結果,而是在這位婦女的情況下,這意味著只有 50% 的感染機率,因為她屬於低風險人群。

統計素養可以改變生活,幫助個人做出更好的個人選擇,識別誤導性廣告和公益廣告資訊,並對自己的健康採取更放鬆的態度。統計素養的夢想體現了啟蒙運動的理想,即人們從自我強加的不成熟狀態中解放出來。用康德的話說,“敢於求知!”

注:本文最初印刷時的標題為“瞭解你的機率”。

(延伸閱讀)

  • 《交流統計資訊》。烏爾裡希·霍夫拉格、塞繆爾·林賽、拉爾夫·赫特維格和格爾德·吉格倫澤在《科學》雜誌,第 290 卷,第 2261–2262 頁;2000 年 12 月 22 日。

  • 《計算風險:如何知道數字何時欺騙你》。格爾德·吉格倫澤。西蒙與舒斯特出版社,2002 年。

  • 《我應該接受癌症檢測嗎:可能不應該,原因如下》。H. 吉爾伯特·韋爾奇。加利福尼亞大學出版社,2004 年。

  • 《讓數字發揮作用:風險溝通的現在和未來研究》。安吉拉·法格林、彼得·A·烏貝爾、迪倫·M·史密斯和布萊恩·J·齊克蒙德-費舍爾在《美國健康行為雜誌》上發表,第 31 卷,第 1 期增刊,第 S47–S56 頁;2007 年 9 月/10 月。

  • 《以不同形式呈現治療益處的效果的薈萃分析》。朱迪思·科維在《醫療決策》雜誌,第 27 卷,第 5 期,第 638–654 頁;2007 年 9 月/10 月。

  • 《學生如何重新學習統計學:當前統計學教學與學習研究綜述》。瓊·加菲爾德和達尼·本-茲維在《國際統計評論》雜誌,第 75 卷,第 3 期,第 372–396 頁;2007 年 12 月。

  • 《瞭解你的機率:理解健康統計資料》。史蒂文·沃洛辛、莉薩·M·施瓦茨和 H. 吉爾伯特·韋爾奇。加利福尼亞大學出版社,2008 年。

  • 《健康的懷疑主義》。莉薩·M·施瓦茨、史蒂文·沃洛辛和 H. 吉爾伯特·韋爾奇在《華盛頓郵報》上發表。可在 www.vaoutcomes.org/washpost.php 上查閱

格爾德·吉格倫澤是柏林馬克斯·普朗克人類發展研究所所長和哈丁風險素養中心主任,該中心於 2009 年在柏林成立。他是柏林-勃蘭登堡科學院院士和德國國家科學院“利奧波第那”院士。他的研究興趣包括風險能力和風險溝通,以及不確定性和時間壓力下的決策。

更多作者:格爾德·吉格倫澤
SA Mind Vol 20 Issue 2本文最初以“瞭解你的機率”為題發表於 SA Mind 第 20 卷第 2 期(),第 44 頁
doi:10.1038/scientificamericanmind0409-44
© .