新型文字搜尋揭示電子健康記錄中隱藏的疾病關聯和安全資料

加入我們的科學愛好者社群!

本文發表於《大眾科學》的前部落格網路,反映了作者的觀點,不一定代表《大眾科學》的觀點


不難想象,記錄在電子健康記錄 (EHR) 中的所有資料可以用於研究疾病和繪製趨勢圖。然而,將這些資料付諸實踐的問題之一是,這些表格的維護並不統一——根據一些研究人員的說法,具有標準化程式碼的更結構化部分缺乏細微差別,甚至可能具有誤導性。新的工具,利用自然語言搜尋,可以克服這些缺點,並從 EHR 的標準部分中發現未見的關聯。

這些工具利用了一個事實,即醫療保健工作者在記錄的自由文字註釋部分中記下了許多有說服力的——甚至可以說是更準確和完整的——關於患者的資訊,而不是編碼在標準化的符號中。“這些註釋詳細描述了患者病情、他們對臨床護理的優先事項以及他們接受某些藥物但不接受其他藥物的意願的體徵和症狀,”哈佛大學公共衛生學院的阿希什·賈在JAMA,美國醫學會雜誌一篇論文中寫道。

然而,像其他形式的隨意寫作一樣,內容可能古怪且不可預測,這使得大規模的快速分析變得困難。目前,這些更自由形式的註釋需要手動閱讀。但是,如果有一種方法可以大規模分析這些資源,數字醫療資料的範圍可能會擴大許多數量級。


關於支援科學新聞報道

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保關於塑造我們當今世界的發現和想法的具有影響力的故事的未來。


賈指出:“自然語言處理有可能透過分析醫療記錄中單詞和短語的上下文來改變格局,使其可用於計算機處理,從而實現自動解釋 EHR。”

一組研究人員評估了來自不同退伍軍人健康管理局醫療中心的數千份 EHR,以尋找常見手術後的併發症。在對記錄進行自然語言搜尋後,他們發現不良結果(如膿毒症和腎衰竭)的發生率約為僅評估記錄的標準數字程式碼時的 12 倍。該研究由範德比爾特流行病學中心的哈維·默夫領導,於週二線上發表在JAMA上。

一個丹麥團隊一直在尋找一種方法來跨系統和語言評估這些自由文字部分。“在世界範圍內,醫療記錄中手動插入的醫學術語在很大程度上受到當地實踐和計費目的的影響,”丹麥技術大學的索倫·布魯納克在一份準備好的宣告中說。布魯納克和他的同事開發了一個基於國際疾病分類詞典的搜尋程式,該詞典提供了跨語言翻譯的標準術語。他們報告說,與單獨分析醫學程式碼相比,當新增他們的搜尋時,他們發現了大約 10 倍的相關患者臨床資訊。他們的研究結果於 8 月 25 日線上發表在PLoS Computational Biology上。

除了能夠更好地發現廣泛趨勢外,這些搜尋工具也可能有助於加快向更個性化護理的轉變。“使用我們的方法,我們獲得了每個患者更精細的臨床特徵,這最終也可能對選擇個性化治療方案非常有價值,”布魯納克說。

他和他的小組將他們的發現更進一步,將他們發現的相關性與遺傳資料進行匹配,希望建立一個新的模型,用於“將電子患者記錄資料直接連線到 DNA 測序”,布魯納克說。

總的來說,電子健康資訊資料探勘領域“可能顯得深奧,但其意義不容低估”,賈寫道。“這些發現表明,EHR 可以改變醫療保健服務。”

© .