美國急診室的平均等待時間超過兩個小時,這使得臨床醫生和患者都感受到系統負擔過重的痛苦。許多父母都經歷過帶著焦躁不安的孩子等待數小時,由於不緊急而被分流,最終卻因為普通的病毒感染而被送回家,還服用了不必要的抗生素。
考慮到去急診室和緊急護理中心花費的金錢和時間,重新回到老式的醫生上門問診的方式具有很強的吸引力。如果上門問診的是一臺智慧機器呢?人工智慧系統已經擅長識別醫學影像中的模式以輔助診斷。2月11日發表在《自然醫學》上的新研究結果顯示,類似的訓練可以用於從兒童病歷中的原始資料中得出診斷。
在這項中國南方廣州市婦女兒童醫療中心的研究中,一個醫生團隊將數千份健康記錄中的資訊提煉成與不同診斷相關的關鍵詞。然後,研究人員將這些關鍵詞教給人工智慧系統,使其能夠檢測真實病歷中的術語。經過訓練後,該系統梳理了567,498名兒童的電子健康記錄(EHR),解析了現實世界中醫生的筆記並突出了重要資訊。
支援科學新聞報道
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您將有助於確保有關當今塑造我們世界的發現和想法的具有影響力的故事的未來。
它從55個類別中由寬泛到具體地進行診斷。那麼這個機器人醫生做得如何?“我認為它相當不錯,”杜克大學醫學中心放射學副教授穆斯塔法·巴希爾說,他沒有參與這項工作。“從概念上講,它不是那麼原創,但資料集的大小和成功執行很重要。” 巴希爾說,資料處理遵循典型的步驟,即獲取“龐大的混亂資料集”,將其透過演算法,並從混亂中產生秩序。從這個意義上說,他說這項工作不是特別新穎,但“也就是說,他們的系統似乎表現良好。”
醫學既是一門藝術,也是一門科學。懷疑論者可能會爭辯說,一臺處理了大量患者資料的計算機無法提供全科醫生從遠處診斷人類所做的那種定性判斷。不過,在這種情況下,在機器訓練開始之前,已經投入了大量的人力專業知識。“這是一個我們大約四年前啟動的大型專案,”加州大學聖地亞哥分校眼科教授、眼科遺傳學主任,研究作者張康說。他和他的同事首先組成一個醫生團隊,審查了6,183份病歷,以收集標記疾病相關症狀或體徵(例如“發燒”)的關鍵詞。然後,人工智慧系統對這些關鍵詞及其與55個國際上使用的特定疾病診斷程式碼(例如急性鼻竇感染)的關聯進行了訓練。在解析圖表以查詢相關術語時,該系統逐步執行特定短語的“存在/不存在”選項,以得出最終的診斷決定。
為了檢查系統的準確性,張和他的同事還採用了老式的“技術”——人類診斷醫師。他們將機器的結論與原始記錄中的結論進行了比較,並且他們還讓另一組臨床醫生使用與人工智慧系統相同的資料進行診斷。
該機器獲得了良好的評分,大約 90% 的時間與人類的診斷一致。它在識別神經精神疾病和上呼吸道疾病方面尤其有效。對於最常見的急性上呼吸道感染,該人工智慧系統在 95% 的時間裡都做出了正確診斷。95% 是否足夠好?張說,下一個需要研究的問題之一是該系統是否會遺漏一些嚴重的問題。他說,基準應該是高階醫生的表現,他們也不是 100% 正確。
人類臨床醫生將作為人工智慧系統的質量控制備份。實際上,人和機器可能會遵循類似的步驟。就像醫生一樣,機器從一個廣泛的類別(如“呼吸系統”)開始,從上到下進行工作以得出診斷結果。“它模仿了人類醫生的決策過程,”韋恩州立大學計算機科學副教授朱東曉說,他沒有參與這項研究。
但朱認為這是“增強智慧”而不是“人工智慧”,因為該系統僅處理了 55 個診斷選項,而不是現實世界中的數千種可能性。他說,該機器還不能深入研究診斷的更復雜方面,例如伴隨狀況或疾病階段。該系統在中國環境之外的翻譯效果如何尚不清楚。巴希爾說,儘管在任何地方將人工智慧應用於患者資訊都很困難,但這些作者已經證明這是可以實現的。
此外,朱還表達了更多的懷疑。他說,在電子病歷中從文字註釋中提取診斷關鍵詞在英語等語言中將與中文“截然不同”。他還指出,僅進行 55 種診斷需要付出大量努力,包括 20 名兒科醫生花費人力對 11,926 份記錄進行評分,以將其結論與機器的診斷進行比較。考慮到整個過程花費了四年時間,父母們可能還需要等待很長時間,才能讓計算機化的臨床醫生讓他們免去前往急診室的麻煩。
