談論引起轟動。兩年前,希臘約阿尼納大學的醫學研究員約翰·約安尼迪斯提供了數學上的“證明”,表明大多數已發表的研究結果都是錯誤的。現在,統計學家使用類似的方法發現——毫不奇怪——研究人員重複一項發現的次數越多,該發現為真的機會就越大。
另一個研究團隊表示,研究人員必須從不完善的資訊中得出結論,但提供了一種在合理和不合理的風險之間劃清界限的方法。
與此同時,作為可能發生變化的跡象,一些遺傳學研究人員已開始更緊密地合作,以努力防止錯誤並提高研究結果的準確性。
關於支援科學新聞
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保未來能夠繼續講述關於發現和塑造我們當今世界的想法的具有影響力的故事。
在他廣為閱讀的2005年PLoS Medicine論文中,臨床和分子流行病學家約安尼迪斯試圖解釋為什麼醫學研究人員必須經常撤銷過去的宣告。僅在過去幾年中,研究人員不得不對低脂、高纖維飲食的健康益處、激素替代療法的價值和安全性以及關節炎藥物萬絡(Vioxx)進行反思,該藥物因被發現會導致高危患者心臟病發作和中風而被撤出市場。
約安尼迪斯使用簡單的統計方法,在沒有關於已發表研究資料的情況下,認為大型隨機臨床試驗(人類研究的黃金標準)的結果可能有15%的錯誤,而規模較小、不太嚴謹的研究結果可能會更糟。
他說,造成錯誤的最可能原因包括:研究人員缺乏協調以及偏見,例如傾向於只發表與他們預期或希望發現的結果相符的結果。有趣的是,約安尼迪斯預測,該領域的研究人員越多不一定越好——特別是如果他們像支離破碎的美國情報界一樣,過度競爭和偷偷摸摸,後者未能分享可能阻止2001年9月11日對世界貿易中心和五角大樓的恐怖襲擊的資訊。
但約安尼迪斯遺漏了一個轉折:根據當前PLoS Medicine上發表的一項研究,每次新的研究重複相同的結果時,發現正確的機率就會增加。該研究的主要作者,美國疾病控制與預防中心的統計學家拉馬爾·穆內辛格表示,為了簡單起見,他的團隊忽略了透過重複相同的偏見來複制結果的可能性。他說,偏見的存在會降低但不會消除重複的價值。
“我完全同意,重複是提高可信度的關鍵,而且重複比發現更重要,”約安尼迪斯說。但他補充說,偏見也必須被消除,否則重複可能還不夠。例如,研究人員在備受吹捧的2006年Science文章中報道說,他們發現了一種似乎會增加肥胖風險的基因變異,並且他們在四個人群中重複了這些結果。上個月,他們承認該發現可能是錯誤的。
約安尼迪斯說,研究人員在從基因組學和其他研究中獲取大量資料以及以不同方式解讀資料方面變得越來越老練——就像電視天氣預報員每天都宣稱某種破紀錄的氣象事件一樣。因此,他說,很容易得出在統計意義上“顯著”但在科學上無效的發現。
為了應對這種豐富的貧乏,約安尼迪斯建議研究人員更多地合作以確認彼此的發現。為了實現這一目標,他和其它的遺傳學研究人員在兩年前建立了一個研究聯盟網路,現在由26個小組組成,他說,每個小組都有十幾到數百名成員,供研究人員研究各種癌症、艾滋病毒、帕金森病和其他疾病。這些小組旨在幫助每個領域的團隊重複彼此的工作。
坦帕市H. Lee Moffitt癌症中心和研究所的腫瘤學家本傑明·朱爾貝戈維奇指出,無論有沒有網路,醫生和衛生官員也必須根據可能被推翻的已發表研究來決定如何治療患者。他和他的同事在第二篇PLoS論文中認為,醫生的決定應該基於對不同型別研究的誤差估計(例如約安尼迪斯計算的那些)、這些研究中報告的治療的潛在益處,以及如果發現結果是錯誤的,他們的患者可以承受多少益處(或可以忍受多少傷害)的組合。
“我們不能在100%確定的情況下工作,”朱爾貝戈維奇說。“問題是:假到什麼程度算假?”他說,一項良好實施的隨機試驗更可能產生正確的結果,但如果風險較低且潛在益處很大,那麼一項不太嚴謹的研究可能仍然會讓醫生滿意。
約安尼迪斯同意完全的確定性是不可能的。“如果你患有重病,只有一種藥物可用,並且你知道它只有5%的可能性有效,為什麼不使用它呢?”他說。但他補充說,實施這種計算比看起來更棘手,因為“我們不能在缺乏強有力的資料證明這一點的情況下,就假定干預措施必然是安全的。”