檢測膿毒症的演算法使死亡率降低近 20%

在兩年多的時間裡,一個機器學習程式向數千名醫護人員預警了膿毒症高風險患者,使他們能夠提前近兩小時開始治療

Sepsis

膿毒症。複合彩色掃描電子顯微照片 (SEM)。迴圈系統紅細胞中的細菌。當有害細菌菌株進入血液時,由此產生的感染稱為細菌性膿毒症或菌血症(俗稱敗血症)。

住院患者面臨許多危及生命的併發症風險,尤其是膿毒症——這種疾病可在數小時內致死,並且是美國醫院死亡的三分之一的促成因素。在美國醫院死亡。過度勞累的醫生和護士通常沒有太多時間陪伴每位患者,這個問題可能會被忽視,直到為時已晚。

學術界和電子健康記錄公司已經開發出自動化系統,傳送提醒以檢查患者是否患有膿毒症,但大量的警報會導致醫護人員忽略或關閉這些通知。研究人員一直在嘗試使用機器學習來微調此類程式,並減少它們生成的警報數量。現在,一種演算法已在真實醫院中證明了其價值,幫助醫生和護士平均提前近兩小時治療膿毒症病例,並將該疾病的醫院死亡率降低了 18%。

膿毒症發生在身體對感染的反應失控時,可能導致器官衰竭、肢體喪失和死亡。據美國疾病控制與預防中心稱,美國每年約有 170 萬成年人患上膿毒症,其中約有 27 萬人死亡。雖然大多數病例起源於醫院外,但這種情況是住院患者死亡的主要原因。儘快發現問題對於預防最壞的結果至關重要。“膿毒症螺旋式發展非常快——如果你不及時治療,可能在幾個小時內就會惡化,” Bayesian Health 執行長兼創始人 Suchi Saria 說,該公司開發用於醫療用途的機器學習演算法。“我的侄子死於膿毒症。例如,在他的案例中,直到他已經處於所謂的感染性休克的晚期階段時,才懷疑或檢測到膿毒症……那時就更難康復了。”


支援科學新聞報道

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您將幫助確保有關塑造我們當今世界的發現和想法的具有影響力的故事的未來。


但在繁忙的醫院中,及時的膿毒症診斷可能很困難。Saria 解釋說,根據目前的護理標準,當患者出現發燒和意識模糊等四種膿毒症警告訊號中的任何兩種時,醫護人員應注意。一些現有的警告系統會在發生這種情況時提醒醫生——但 Saria 說,許多患者在典型的住院期間至少會出現四項標準中的兩項,這可能會使警告程式的誤報率很高。“許多其他程式的誤報率非常高,以至於提供者甚至在沒有確認的情況下就關閉了警報,” 緊急醫學醫師兼非營利組織膿毒症聯盟主席 Karin Molander 說,她沒有參與新的膿毒症檢測演算法的開發。由於警告訊號的普遍性,醫生還必須考慮患者的年齡、病史和最近的實驗室檢查結果等因素。然而,彙總所有相關資訊需要時間——膿毒症患者沒有時間。

在一個連線良好的電子記錄系統中,已知的膿毒症風險因素是可用的,但可能需要時間才能找到。這就是機器學習演算法的用武之地。一些學術界和行業團體正在教導這些程式識別膿毒症和其他併發症的風險因素,並警告醫護人員哪些患者處於特別危險之中。Saria 和她在約翰·霍普金斯大學(她在那裡指導機器學習和醫療保健實驗室)的同事於 2015 年開始研究一種此類演算法。該程式掃描患者的電子健康記錄,查詢增加膿毒症風險的因素,並將此資訊與當前的生命體徵和實驗室檢查相結合,以建立一個評分,表明哪些患者可能發展為感染性休克。幾年後,Saria 創立了 Bayesian Health,她的團隊在那裡使用機器學習來提高其程式的靈敏度、準確性和速度,該程式被稱為有針對性的即時早期預警系統 (TREWS)。

最近,Saria 和一個研究團隊評估了 TREWS 在現實世界中的表現。該程式在兩年多的時間裡被納入約翰·霍普金斯醫學系統附屬的五個地點的約 2,000 名醫護人員的工作流程中,涵蓋了資源充足的學術機構和社群醫院。醫生和護士在超過 76 萬次患者就診中使用該程式,其中包括超過 17,000 名患上膿毒症的患者。這項試驗的結果表明,TREWS 導致了更早的膿毒症診斷並降低了死亡率,這些結果描述在三篇論文中,這些論文於上個月底發表在 npj Digital MedicineNature Medicine 上。

“我認為這種機器學習模型可能對膿毒症護理至關重要,就像心電圖 [心電圖] 機器在診斷心臟病發作方面所證明的那樣,”Molander 說。“它將允許臨床醫生從計算機……試圖分析 15 年的資訊,回到床邊,更迅速地重新評估患者——這正是我們需要做到的。”

TREWS 不是第一個在此類試驗中證明其價值的程式。Mark Sendak 是杜克大學健康創新研究所的醫生、人群健康和資料科學負責人,他致力於杜克大學研究人員開發的類似程式,稱為 Sepsis Watch。他指出,其他專注於醫療保健的機器學習系統——不一定是專門為膿毒症檢測而建立的系統——已經經歷了大規模試驗。一項開創性的基於人工智慧的系統用於診斷糖尿病併發症的測試是在美國食品和藥物管理局的投入下設計的。 其他程式也在多個不同的醫院系統中進行了測試,他指出。

“這些工具在改善我們護理患者的方式方面發揮著重要作用,”Sendak 說,並補充說新系統“是另一個例子”。他希望看到更多的研究,最好是標準化的試驗,這些試驗涉及外部合作伙伴(如 FDA)的研究支援和指導,這些合作伙伴與結果沒有利害關係。這是一個挑戰,因為設計機器學習系統的醫療保健試驗非常困難,包括關於 TREWS 的新研究。“任何將演算法投入實踐並研究其使用方式及其影響都是非凡的,”他說。“並在同行評審的文獻中做到這一點——非常值得稱讚。”

作為一名急診室醫生,Molander 對人工智慧不會代表醫護人員做出膿毒症決定這一事實印象深刻。相反,它會標記患者的電子健康記錄,以便當醫生或護士檢查記錄時,他們會看到一條註釋,指出患者有膿毒症風險,以及列出原因。與某些程式不同,TRWES 的警報系統不會阻止“臨床醫生在未確認警報的情況下進行任何其他計算機工作”,Molander 解釋說。“他們在系統的角落裡有一個小提醒,說‘看,這個人因膿毒症而導致失代償[器官衰竭]的風險更高,這些是我們認為您需要關注的原因。’”這有助於忙碌的醫生和護士優先考慮首先檢查哪些患者,而不會剝奪他們做出自己決定的能力。“他們可以選擇不同意,因為我們不想剝奪提供者的自主權,”Saria 說。“這是一個輔助工具。這不是一個告訴他們該怎麼做的工具。”

該試驗還收集了有關醫生和護士是否願意使用 TREWS 等警報系統的資料。例如,其 89% 的通知實際上被評估了,而不是像 Molander 描述的其他一些系統那樣被自動駁回。醫護人員願意檢查該程式可能是因為 TREWS 將膿毒症誤報警告通知的高發生率降低了 10 倍,根據 Bayesian Health 的新聞稿,這減少了警報的狂轟濫炸,並使其更容易區分哪些患者真正處於危險之中。“這太令人震驚了,”Molander 說。“這非常重要,因為它使提供者能夠提高他們對機器學習的信任。”

建立信任很重要,但收集證據也很重要。如果沒有證據證明機器學習系統執行良好,醫療機構不太可能接受它們。“在科技領域,如果人們相信思考過程,他們會更願意採納新想法。但在醫學領域,您真的需要嚴格的資料和前瞻性研究來支援可擴展采用的主張,”Saria 說。

“在某種程度上,我們正在構建產品,同時也在構建證據基礎和標準,以規範這項工作需要如何進行,以及潛在的採用者需要如何審查我們正在構建的工具,”Sendak 說。任何演算法警報系統要實現廣泛採用都具有挑戰性,因為不同的醫院可能使用不同的電子記錄軟體,或者可能已經有競爭系統到位。許多醫院的資源也有限,這使得他們難以評估演算法警報工具的有效性——或在這些系統不可避免地需要維修、更新或故障排除時獲得技術支援。

儘管如此,Saria 希望使用新的試驗資料來擴大 TREWS 的使用範圍。她說她正在與多家電子記錄公司建立合作伙伴關係,以便將該演算法納入更多醫院系統。她還想探索機器學習演算法是否可以警告人們在醫院可能經歷的其他併發症。例如,必須監測一些患者的心臟驟停、大出血和褥瘡,這些都可能影響住院期間和之後的健康。

“我們已經對‘正確完成的人工智慧’有了很多瞭解,並且我們已經對此進行了大量發表。但現在表明的是,正確完成的人工智慧實際上獲得了提供者的採用,”Saria 說。透過將人工智慧程式納入現有的記錄系統,在那裡它可以成為醫護人員工作流程的一部分,“您可以突然開始削減所有這些可預防的危害,以改善結果——這有利於系統、有利於患者,也有利於臨床醫生。”

Sophie Bushwick大眾科學 的技術編輯。她負責網站的日常技術新聞報道,撰寫從人工智慧到跳躍機器人的所有內容,用於數字和印刷出版物,錄製 YouTube 和 TikTok 影片,並主持播客 Tech, Quickly。Bushwick 還經常出現在廣播節目(如 Science Friday)和電視網路(包括 CBS、MSNBC 和國家地理)中。她擁有十多年在紐約市擔任科學記者的經驗,此前曾在 Popular Science、Discover 和 Gizmodo 等媒體工作。在 X(以前的 Twitter)上關注 Bushwick @sophiebushwick

更多作者:Sophie Bushwick
© .