最佳良藥:透過比較效果研究降低醫療成本

比較效果研究領域的靜悄悄的革命或許能將我們從飛漲的醫療成本中拯救出來

這是有史以來規模最大、最重要的針對高血壓治療的調查,其耗資也十分巨大。美國醫生招募了來自 623 個辦公室和診所的 42,418 名患者,使用四種常用處方藥之一對參與者進行治療,並對他們進行了至少五年的隨訪,以觀察藥物控制血壓的效果以及降低心臟病發作、中風和其他心血管問題的風險。它符合醫學研究的最高標準:醫生和患者都不知道誰被分配到哪個治療組,並且患者有均等的機會被分配到任何一組。長期以來,這種隨機對照試驗在確定藥物和其他治療的安全性和有效性方面是無與倫比的。這項名為 ALLHAT(抗高血壓和降脂治療預防心臟病發作試驗)的試驗,估計耗資 1.2 億美元,耗時八年完成。

2002 年 12 月宣佈的結果令人震驚:最古老且最便宜的藥物,即噻嗪類利尿劑,在降低高血壓方面比更新、更昂貴的藥物更有效。此外,利尿劑透過排出體內多餘液體發揮作用,在降低發生心力衰竭、住院和中風的風險方面效果更好。美國國家心肺血液研究所 (NHLBI) 認為,ALLHAT 絕對物有所值,該研究所負責執行該試驗。如果患者因高血壓而開具利尿劑而不是更昂貴的藥物,那麼僅處方藥費用一項,全國每年就可節省 31 億美元,並且透過避免中風治療、冠狀動脈搭橋手術和高血壓的其他後果,還能節省數億美元。

但是,如果像 60% 的 ALLHAT 患者那樣,僅靠利尿劑無法控制血壓,患者應該怎麼辦?他們接下來應該轉向哪些藥物?那是接下來要進行的合乎邏輯的研究,但 NHLBI 無法負擔得起進行另一項隨機對照試驗來找出答案。這時,大衛·J·馬吉德有了他的偉大想法。作為科羅拉多州珀曼內特醫療集團(巨型凱撒珀曼內特醫療保健組織的一部分)的研究主任,馬吉德和任何一位科學家一樣尊重經典的臨床試驗。但他認為,有一種方法可以在不經歷漫長的時間和試驗費用的情況下,獲得同樣嚴謹的結果。相反,他認為,他可以梳理凱撒資料庫中數千份電子健康記錄,以找出如果利尿劑不能帶來所需的血壓降低,哪些抗高血壓藥物效果最好。


支援科學新聞報道

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保有關塑造我們當今世界的發現和想法的具有影響力的故事的未來。


馬吉德在一年半的時間裡找到了答案,成本僅為 20 萬美元,僅為臨床試驗預期成本的一小部分。他和他的同事在 2010 年報告稱,另外兩種心臟藥物,即血管緊張素轉換酶 (ACE) 抑制劑和 β 受體阻滯劑,作為二線治療藥物,效果同樣有效。醫生可以為僅靠利尿劑無法控制血壓的患者開具這兩種藥物中的任何一種。“隨機試驗非常昂貴且耗時,我們不可能為所有需要解答的重要問題都進行試驗,”馬吉德說。“使用健康記錄[比較治療方法]提供了一種實用的替代方案。”

艱難的真相
馬吉德是日益有影響力的運動的先驅,該運動旨在改變臨床醫生和研究人員確定哪種藥物、手術或其他治療方法對特定疾病或病症最有效的方式。正式名稱為比較效果研究 (CER),它科學地確定哪些療法有效,哪些無效。這種方法通常最容易理解為不同藥物之間或藥物和手術之間的直接比較。但其方法正被用於評估範圍越來越廣的干預措施,其中許多措施與藥物無關,例如,提供交通和住房援助的社群健康計劃在讓體弱多病的老年男女遠離醫院方面,是否比側重於更傳統的醫療服務的計劃更有效。

對更大程度審查的需求源於緊迫的醫療和經濟挑戰。對 CER 的醫療需求源於一個鮮有患者意識到,更少醫生承認的事實:許多醫療治療的科學依據往往站不住腳,甚至根本不存在。例如,美國傳染病學會發布的一半以上的指南僅基於“專家意見”,而不是實際的比較資料,更不用說臨床試驗了。“實踐中所做的事情與科學已經表明的事情之間存在著巨大的鴻溝,”凱撒有效性和安全研究中心新任主任伊麗莎白·A·麥格林說。與此同時,她指出,臨床醫生抱怨說,科學研究通常無法輕易轉化為現實世界的環境。

比較效果研究的經濟必要性同樣具有說服力。多年來,各個醫療保健計劃一直在比較各種治療方法的成本和結果,以努力削減預算,然而,預計美國醫療保健支出將在 2011 年達到 2.7 萬億美元。對於消費者重視的東西來說,這個數額聽起來可能是一個合理的價格(即使它使其他支出相形見絀,例如五角大樓明年將支出的 6710 億美元)。然而,不必要的醫療保健支出意味著可用於投資、教育、研究和其他國家需求的資金減少。“我們[醫療]支出中高達三分之一用於無效或不必要的護理,”麥格林說,換句話說,每年約為 9000 億美元。(相比之下,根據國會預算辦公室 2009 年的分析,醫療事故改革可以在 10 年內節省約 540 億美元。)“我們不能把錢花在無效的東西上,”她繼續說,尤其是當國家不斷飆升的醫療保健賬單威脅到州和地方政府、企業和醫療保險時,這些是為大多數醫療費用支付的“第三方”。為了透過確保國家只為有效的治療方法付費來節省資金,2009 年的經濟刺激法案為比較效果研究撥款 11 億美元。

這是一大筆錢,但與此類研究的成本相比,只是一筆小數目——至少是傳統型別的 CER,它使用臨床試驗來區分幫助患者的療法和無效的療法——以及需要多少此類研究。國家科學院所屬的醫學研究所 2009 年的一份報告輕鬆確定了 100 個需要解答的相對有效性問題。將 100 個問題乘以每個問題幾億美元,就等於“負擔不起”。因此,需要新穎、成本較低的比較效果研究方法,例如馬吉德的方法,該方法利用最新的資訊科技工具——從挖掘凱撒等大型綜合醫療網路資料庫到疾病的複雜數學建模——努力以隨機對照試驗成本的一小部分來發現有效的方法。

臨床試驗的成本並不是 CER 正在發生的鉅變的唯一推動力。新研究有望產生更好的資訊:比傳統試驗資料更有用於臨床實踐的資料。


原因是臨床試驗傾向於招募更年輕、更健康且更可能服用處方藥的人;研究物件也比普通患者受到醫生的更密切監測。因此,一些醫生反對說,試驗結果可能不適用於他們治療的年齡較大、病情較重、依從性較差的患者。此外,傳統的隨機臨床試驗評估的是療效,這是藥物或其他療法益處的最佳情況、通常是理想化的衡量標準。相比之下,大多數醫生更關心有效性,這意味著治療在現實世界條件下對真實患者的效果如何。因此,醫生可以並且確實會駁回在隨機臨床試驗的溫室中獲得的結果,認為這些結果不適用於他們的患者。例如,儘管有 ALLHAT,但 2009 年的一項研究發現,只有 36% 的高血壓首診處方是利尿劑,這部分反映了一些醫生認為結果與他們的患者無關的觀點。馬吉德認為,如果嚴謹的研究評估不同干預措施的現實世界有效性,更多的醫生可能會將結果納入他們的臨床實踐。

與美國醫療保健交付方式的任何重大變革一樣,CER 也引起了批評者的警惕,他們擔心 CER 可能會限制醫生的自主權和患者的選擇。但是,隨著該領域開發出嚴謹、高效的方法來回答任何患者或醫生都可能提出的最重要的問題——什麼有效?——它將不可避免地在個人和政策層面的醫療保健中發揮越來越重要和關鍵的作用。

進入資料礦井
幸運的是,尋找廉價方法來進行比較效果研究並獲得與現實世界中的真實患者相關的結果的需求,與醫療保健領域的另一項重大變革不謀而合:電子病歷的普及。凱撒珀曼內特擁有 860 萬人的電子病歷。一個新的由六家醫療機構組成的聯盟,包括克利夫蘭診所和梅奧診所,擁有 1000 萬人的電子病歷。退伍軍人事務部是電子健康記錄以及 CER 的先驅,每年為超過 600 萬退伍軍人提供護理。至關重要的是,在每種情況下,醫療機構的記錄都比標準的醫療保險索賠資料更完整,因此更有用,後者通常缺少有關患者的關鍵細節。凱撒、該聯盟和退伍軍人事務部都啟動了計劃來挖掘這些記錄,例如,獲取所有 2 型糖尿病患者,確定他們接受的治療並比較結果。“藉助這些大型資料庫和詳細的臨床資訊,我們可以在現實世界的環境中,對全方位的患者(而不僅僅是為臨床試驗選擇的患者)進行比較效果研究,”凱撒研究部門主任喬·V·塞爾比說。

分析數百萬患者而不是標準臨床試驗中的數百或數千名患者也意味著結果可能在統計學上更可靠——也就是說,發現結果不太可能是偶然的。挖掘患者記錄的另一個優勢:它們包括兒童和育齡婦女,這些人通常被排除在臨床試驗之外,因為風險被認為超過了益處。

乍一看,挖掘資料庫以獲取資訊可能很像進行舊式的觀察性研究,在觀察性研究中,研究人員找到一組恰好正在接受特定療法的患者,以及另一組未接受治療或接受不同療法的患者。相比之下,隨機對照試驗將患者分配為接受一種或另一種治療。觀察性研究產生了巨大的公共衛生效益(例如,表明吸菸會導致肺癌),但它們也可能產生誤導。例如,觀察性研究得出的結論是,在更年期前後雌激素水平開始下降的老年婦女中,長期激素療法降低了患心臟病的風險,並帶來了其他益處。事實上,正如 2002 年的婦女健康倡議(一項前瞻性隨機對照試驗)所表明的那樣,激素替代療法並不能預防心臟病,反而會增加中風和乳腺癌的風險。問題是,在觀察性研究中使用激素替代療法的婦女在重要方面與未使用激素替代療法的婦女不同(如果沒有任何其他不同,她們正在接受醫生的治療)。這些差異,而不是激素療法,導致了婦女患心血管疾病的風險明顯較低。

今天,在健康記錄用於 CER 方面的先驅們非常清楚他們正在進行觀察性研究。但他們已經開發出統計和其他方法來防範可能困擾此類調查的錯誤。關鍵步驟是確保導致特定結果的原因是治療方法,而不是患者的某些特徵,就像激素替代療法的觀察性研究中的情況一樣。“接受一種治療的人與接受另一種治療的人總是可能在某些方面存在差異,”塞爾比說。“為了對此進行調整,您需要非常詳細的資料,而凱撒珀曼內特擁有這些資料。它可以告訴您[比較組中的]患者在所有實際目的上都是相同的,或者允許您在統計上調整任何剩餘差異。”

盲人將看見
南加州珀曼內特醫療集團的眼科醫生唐納德·方利用這些資料比較了兩種治療年齡相關性黃斑變性的方法,年齡相關性黃斑變性是 60 歲以上人群嚴重視力喪失的主要原因。自 2004 年以來,醫生一直在使用基因泰克公司生產的癌症藥物阿瓦斯汀來對抗這種疾病。但這是一種標籤外使用——也就是說,該公司沒有獲得美國食品和藥物管理局的批准,但醫生仍然可以開處方。2006 年,FDA 批准了基因泰克公司生產的另一種藥物 Lucentis 用於治療黃斑變性。阿瓦斯汀和 Lucentis 非常相似,但阿瓦斯汀每劑的成本為 50 美元,而 Lucentis 為 2200 美元。這讓醫生陷入了兩難境地:他們應該繼續標籤外使用阿瓦斯汀,還是將患者轉用 Lucentis?

方知道這個問題迫切需要進行科學比較。然而,他決定不進行漫長而昂貴的隨機對照臨床試驗。相反,從 2005 年到 2008 年,他和他的同事將 452 名凱撒患者納入一個單獨的登記處——所有以前未接受治療且僅接受一種黃斑變性藥物治療的患者。記錄顯示,324 人恰好接受了阿瓦斯汀治療,128 人接受了 Lucentis 治療,這反映了個別醫生和患者的偏好,而不是臨床試驗將使用的隨機分配。科學家在 2009 年報告稱,儘管阿瓦斯汀患者在開始治療時恰好視力較差,並且在隨訪的 12 個月內平均注射次數減少了兩次,但兩種藥物的視力改善程度相同。

這種觀察性研究不如隨機對照試驗的統計學純度。但與其他挖掘健康記錄以進行 CER 的研究人員一樣,方和他的同事使用了標準的統計技術來控制他們的人群研究選擇中隱藏的偏差。他們還確保阿瓦斯汀和 Lucentis 患者在年齡、視力喪失嚴重程度和其他關鍵因素方面相匹配。方認為,結果既科學嚴謹,又比標準臨床試驗更貼近臨床醫生。“這項研究的人群更符合實際情況,”他說。患者的平均年齡約為 80 歲,他們沒有像臨床試驗中的患者那樣受到密切的審查和護理。“我們沒有排除任何人。這使得醫生更難說,‘這不適用於我的患者。’”碰巧的是,4 月份在《新英格蘭醫學雜誌》上線上發表的阿瓦斯汀和 Lucentis 隨機對照試驗第一年的結果也支援了方的發現。

確保統計資料的正確性
透過電子病歷進行 CER 的科學家正在開發多種技術,以確保他們的結果在統計學上是可靠的。最關鍵的是確保兩個或多個比較組中的患者——例如,接受 Lucentis 和阿瓦斯汀的患者,或 β 受體阻滯劑和 ACE 抑制劑的患者——是等效的。為了做到這一點,研究人員分析了大量變數(100 個並不少見),從社會經濟資料到實驗室結果,以檢視是否有任何變數在接受一種治療而不是另一種治療的患者中更常見。塞爾比解釋說,透過考慮這些變數,“您最終會比較具有相同接受治療傾向但實際上接受了其中一種治療的人。”這消除了激素替代療法型別錯誤的風險,在這種錯誤中,接受治療實際上是獲得更好護理的標誌。

例如,在他的抗高血壓研究中,馬吉德分析了醫療記錄,以識別任何不太可能平等地接受兩種藥物(ACE 抑制劑或 β 受體阻滯劑)的患者,例如患有先前存在的疾病,該疾病作為兩種藥物之一的禁忌症。馬吉德說:“我們排除了這些病例,只剩下那些有平等機會被處方 ACE 抑制劑或 β 受體阻滯劑的患者。”然後,他識別出具有相似健康特徵的患者,以減少藥物比較因一種藥物被給予病情較重的患者而產生偏差的可能性。

“我們使人群儘可能地平等,”他說,基於年齡、性別、併發症、生命體徵、實驗室結果(例如,腎功能)以及社會經濟因素(例如,教育和收入)。對於每位 54 歲的白人女性,高中輟學,基線血壓為 150/80,在 β 受體阻滯劑組中,患有這兩種併發症並服用這三種藥物,馬吉德將她與另一位 54 歲的白人女性,高中輟學,基線血壓為 150/80 的 ACE 抑制劑組中的女性相匹配,後者患有相同的疾病並服用相同的藥物。當他完成時,馬吉德已經精心匹配了每位接受 ACE 抑制劑治療的患者和一位接受 β 受體阻滯劑治療的患者。無法以這種方式匹配的患者從研究中剔除。

由於分析詳細的健康記錄比前瞻性隨機對照試驗產生結果的速度快得多,因此它挽救了生命。當一位學術界的同事提到實驗室動物研究暗示用於止痛的萬絡可能增加心臟病發作和中風的風險時,凱撒風溼病學家大衛·H·坎彭使用了這種方法。坎彭和他的同事分析了凱撒的患者記錄,在默克公司於 2004 年自願將萬絡從市場上撤回的幾個月前,發現了完全相同的情況。碰巧的是,服用萬絡和相關藥物(稱為 COX-2 抑制劑)的凱撒患者少於全國平均水平。COX-2 抑制劑不像阿司匹林等其他非甾體抗炎藥 (NSAID) 那樣構成相同的胃腸道出血風險,但並非所有患者都有這種出血風險,因此不需要更新、更昂貴的 COX-2 抑制劑。坎彭回憶說,一度,在美國,COX-2 的使用量接近 NSAID 處方量的 50%,但在凱撒,它一直低於 10%。

醫療保健支出的價值
除了評估不同療法治療特定疾病的效果如何外,新一代比較效果研究人員還旨在比較這些療法的成本,並詢問額外的成本是否能帶來額外的效果。到目前為止,這個問題一直被禁止:美國醫學的核心原則長期以來一直是成本考慮因素在臨床決策中沒有地位。因此,傳統上,CER 並未考慮成本。評估兩種或多種治療方法並按臨床有效性進行排名,僅此而已。但是,醫療保健費用的飆升增加了選擇以最少的醫療保健支出獲得最大效果的治療方法的壓力。

然而,在過去幾年中,成本效益已成為越來越多分析的重點。2006 年,退伍軍人事務部研究人員研究了患有難以治療的缺血性心臟病的患者。一些人接受了血管成形術,外科醫生在血管成形術中拓寬阻塞的血管(通常使用球囊狀裝置),另一些人接受了冠狀動脈搭橋術,在冠狀動脈搭橋術中,血液透過植入的移植物繞過阻塞物重新定向流動。每種手術都有令人印象深刻的三年生存率(血管成形術為 82%,搭橋術為 79%)。但血管成形術的總成本為 63,900 美元,而搭橋術為 84,400 美元。換句話說,血管成形術略微有效,而且成本更低。五年後,75% 的血管成形術患者仍然活著,而搭橋術患者為 70%,各自的成本分別為 82,000 美元和 101,000 美元——再次,更好的生存率,更低的成本。

使用這些結果來實際控制成本的道路不一定一帆風順。2010 年的醫療保健改革法禁止醫療保險使用比較效果研究來決定支付什麼費用(例如,阿瓦斯汀而不是 Lucentis 用於治療黃斑變性),這是對立法者的讓步,立法者希望確保患者和醫生仍然可以自由選擇他們喜歡的任何治療方法,並且威脅說,如果沒有該條款,他們將投票反對該法案。但是,醫療保險可以使用該研究來設定支付率,從而鼓勵提供商以給定的價格提供最佳護理,這種系統稱為“同等結果同等支付”。以黃斑變性為例,醫療保險可能會每次注射支付 50 美元,這意味著堅持使用 Lucentis 或醫生的患者將留下 2150 美元的共同支付額。

讓人們自掏腰包支付更多錢不是目標。這只是達到目標的手段,目標是為患者帶來最有效的治療方法——並且不要透過補貼成本更高但沒有額外益處的治療方法來提高國家的醫療保健費用。“當我們進入醫療保健改革時代時,我們需要解決如何為此付費的問題,”方說。“一個明顯的答案是,你只想為有效的東西付費。”當兩種藥物的效果同樣好時,正如他發現阿瓦斯汀和 Lucentis 對年齡相關性黃斑變性的效果一樣好,那麼計算應該很容易。但是,如果藥物 A 的成本是藥物 B 的 20 倍,但僅產生 5% 的更大益處,例如,以生存率、視力敏銳度、胰島素控制或住院次數來衡量,情況又如何呢?“我們必須開始作為一個社會來問,這種邊際改善是否值得這個價格,”他指出。這肯定會是一場痛苦的對話,迫使社會努力應對我們願意在邊際健康改善上花費多少錢。

未來的障礙
儘管消除無效治療聽起來像是患者、醫生和付款人都會歡迎的事情,但事實上,CER 已經陷入了關於醫療保健改革的辯論的交火之中。指控中最主要的是:正如密歇根州眾議員邁克·羅傑斯在 2009 年警告的那樣,該研究將被用來“拒絕或配給護理”。事實上,該研究並未比較不同型別的患者是否從給定的治療中受益,以此來阻止某個群體接受治療,正如“拒絕或配給”可能暗示的那樣。比較效果研究的目標是淘汰對所有人效果較差的治療方法,並用更有效的替代方法取而代之。“現在正在對 CER 進行攻擊,說這完全是為了醫療保健配給,”克利夫蘭診所的心臟病專家史蒂文·尼森說。“即使那不是我們正在談論的內容,他們也在取得進展。CER 是關於提供最佳護理,而不是配給護理。”

健康專家說,這種疑慮是美國獨有的。英國研究人員在去年《藥物經濟學》雜誌的一篇文章中辯稱,在沒有其他國家的人“像美國利益相關者(包括很大一部分政策制定者)那樣懷疑地看待證據”。英國很久以前就接受了比較效果研究,將其研究結果納入關於其國家醫療服務體系將涵蓋哪些內容的決策中。證據表明,CER 並非萬能藥;英國的醫療保健費用仍在上漲——儘管沒有美國那樣陡峭。但是,基於 CER 做出醫療保健決策顯然並沒有傷害英國人,他們的預期壽命實際上高於美國人。

“如果世界上有任何國家需要比較效果研究,那就是美國,”尼森說。“可以肯定地說,美國的醫療是最不具成本效益的。浪費了太多錢,如果我們消除這種浪費,我們就可以為每個人提供醫療保健。”在一個比尊重科學更尊重個人選擇權的國家,這將是一場艱苦的戰鬥。但比較效果研究是我們公平地改善醫療保健而又不至於傾家蕩產的最佳希望。

© .