FDA為何想要加強對某些實驗室測試的控制 

FDA發現許多所謂的實驗室衍生測試實際上可能危害患者

阿列克謝·維拉

在美國,醫生辦公室和醫院每年訂購數十億次的實驗室測試,以測量從血液中的膽固醇水平到被認為會增加患阿爾茨海默病風險的基因的存在等各種指標。醫生和患者通常認為他們可以信任這些測試的結果。大多數時候他們也的確可以。但並非所有實驗室測試都同樣可靠,錯誤的測試可能會產生嚴重的後果。有時它們無法檢測出危及生命的疾病。有時它們會指示一個不存在的問題,這可能導致不必要的,甚至可能是有害的治療。

由於監管歷史上的一個怪癖,許多此類測試不受與其他用於識別疾病風險或明確診斷病症的工具相同的醫療標準的約束。這些被稱為實驗室研發測試,或LDTs,定義為由設計它們的同一家實驗室製造和解讀的測試——與例如,旨在被各地醫生辦公室的各種人員使用和理解的快速鏈球菌測試形成對比。大多數人第一次接觸LDT是在體檢時,當醫生面臨無法透過廣泛可用的血液測試解決的診斷難題時。

問題是,專家認為許多這些測試沒有用處,有些甚至可能透過讓太多人相信他們患有罕見疾病而造成傷害,診斷出他們患有一種迄今為止尚未被證明有害的疾病,或者讓他們安心,認為自己是健康的,而事實上,沒有科學可信的方法來知道情況是否確實如此。“我們傾向於認為實驗室測試是最終的真理,”哈佛醫學院病理學助理教授拉米·阿爾瑙特說。“但沒有哪項測試是百分之百準確的,而且其中一些LDT根本沒有醫學用途。”


支援科學新聞報道

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保有關塑造我們當今世界的發現和想法的具有影響力的故事的未來。


美國食品和藥物管理局 (FDA) 正在採取措施恢復人們對實驗室研發測試可靠性的信心。2014年,該機構釋出了擬議指南,首次將這些措施置於聯邦監管之下——包括在測試上市前必須向其提交有效性證據。儘管FDA不願對本文發表評論,但多位業內人士認為,最終裁決可能很快開始生效,這讓一些實驗室主任感到懊惱,他們表示,這些要求可能會增加成本並阻礙醫療實踐。

不斷擴大的漏洞

25年前,LDT在醫療實踐中扮演的角色太小,FDA沒有過多關注。只有少數幾種——最著名的是用於檢測宮頸癌的巴氏塗片——被廣泛使用。FDA官員採取了“執法酌處權”政策,這意味著他們幾乎對LDT不聞不問,而專注於那些顯然更可能造成危害的工具,例如故障的心臟起搏器。

然而,在研究人員於20世紀90年代開發出新的基因工程技術後,LDT的可能性大大擴充套件。例如,前幾代LDT尋找少量不尋常的蛋白質,而一些新興的基因測試可以篩選人類基因組中發現的30億個鹼基對或字母中的任何數量,尋找與疾病相關的異常。此外,測試變得自動化,使LDT的設計和使用變得越來越容易。

技術的進步導致上市的LDT的數量和種類大幅增加。據一些估計,現在約有11,000家實驗室提供60,000到100,000種LDT;沒有人確切知道有多少,因為,當然,這些測試不必在任何地方註冊。

根據當前的聯邦法規,LDT享有很大的漏洞,這意味著它們不必評估其醫學用途。也不要求公開有關它們的研究。建立它們的實驗室確實需要滿足某些科學實踐的基本標準。但是,FDA不會像對大多數處方藥或醫療器械那樣,在醫生可以開始為患者訂購測試之前或之後對測試進行審查。

這個漏洞意味著,從僅提供一兩項測試的小型初創公司到提供數千項測試的大型診斷實驗室,各種規模的公司都可以比大多數其他類別的醫療產品更容易地開發新LDT並收取費用。隨著測試數量的增加,一系列報告顯示,某些測試已經透過提供誤導性結果傷害了人們。

臨床有效性

FDA已將20種不同型別的LDT列為特別令人擔憂的,包括經常給出錯誤答案的萊姆病和百日咳測試,以及聲稱可以確定女性患卵巢癌風險的LDT,例如透過測量血液中CA 125蛋白的存在。9月份,該機構得出結論,針對這種蛋白質的篩查措施“沒有被證實的益處”,並警告醫生不要推薦或使用它們。

許多引起FDA憤怒的測試可能確實測量了它們聲稱要測量的東西。問題是,測量的物質可能不是特定醫療問題的良好指標。例如,在卵巢癌測試的情況下,在理論上,卵巢中產生的CA 125水平升高應表示存在額外的卵巢細胞——換句話說,存在腫瘤。但實際上,事實證明,許多CA 125水平高的女性並沒有患卵巢癌,相反,許多患有癌症的女性CA 125水平並不高。因此,CA 125的測量結果不能被信任為對癌症進行準確診斷——然而,許多檢測結果呈陽性的女性顯然非常害怕患癌症的可能性,以至於她們決定切除健康的卵巢。

研究人員確定是否應將醫學測試用作患者病情的指南的一種方法是應用一種有些晦澀的統計比率,稱為陽性預測值,或PPV。該指標考慮了某種疾病在特定人群中可能有多常見。

透過類比可以更好地理解為什麼這種考慮在確定測試的有用性方面很重要。如果你把一個帶誘餌的魚鉤扔進一個裝滿魚的桶裡,那麼繩子上的一拉就意味著你釣到了一條魚的可能性非常高。另一方面,將同一個帶誘餌的魚鉤扔進一個沒有放養魚的淡水湖中,任何給定的繩子拉動代表一條魚的可能性就會小得多,而不是,例如,樹枝。因為桶中給定體積的水的魚比湖泊多得多,所以容器中的拉動的PPV接近100%,而未放養的湖泊中的拉動的PPV遠低於100%。

這種關鍵的統計區別解釋了FDA對一種當前卵巢篩查測試的問題,該測試的開發者聲稱其PPV為99.3%。然而,獨立生物統計學家的更仔細分析顯示,該值是根據一項單一實驗計算得出的,在該實驗中,一半的患者已知已患有卵巢癌——這是一個高度選擇的群體,相當於醫學上的放養池塘。

當研究人員使用卵巢癌在美國普通人群中的真實頻率(每2,500名絕經後婦女中有一例病例)重新計算PPV時,PPV驟降至僅6.5%。換句話說,每15名從該惡性腫瘤測試中獲得陽性結果的患者中,只有一人實際上患有卵巢癌。如果其他14人僅依賴這項測試,則很可能會接受不必要的手術來切除她們原本健康的卵巢,因為她們會錯誤地認為自己有99.3%的機率患上癌症。

改變重點

由於FDA沒有資源來監管近年來上市的所有LDT,該機構計劃根據特定測試的誤導性或不正確結果可能造成重大危害的可能性,將其分為三類。根據新的指導方針,如果不準確的結果可能導致死亡或長期殘疾,LDT將被視為高風險。此類測試將受到最嚴格的檢查,有關它們的資訊將需要輸入國家資料庫,製造商必須在銷售之前向FDA證明其安全性和有效性。“基本上,FDA希望在允許高風險LDT上市之前看到支援性證據,”約翰·霍普金斯大學彭博公共衛生學院的醫生和教授約書亞·沙夫斯坦說。

即使是這種有針對性的方法也讓許多行業領導者和一些專業醫學協會(包括美國醫學會)感到擔憂。“這實際上取決於FDA如何選擇定義高風險,而目前尚不清楚,”明尼蘇達州羅切斯特市梅奧醫學實驗室的首席醫療官柯蒂斯·漢森說,該實驗室每年進行2500萬次實驗室測試。“高風險測試可能佔當今市場上LDT的1%到10%。FDA將如何審查並找到罕見的問題案例,並以一種不會減慢進展速度的有效方式做到這一點?”

對於患者及其醫生來說,問題要基本得多。他們為什麼應該總是懷疑市售的醫學測試是否弊大於利?

© .