本文發表於《大眾科學》的前部落格網路,反映了作者的觀點,不一定反映《大眾科學》的觀點
本部落格是慶祝《大眾科學·心靈》創刊十週年而推出的關於技術與大腦的系列客座文章中的第一篇。《大眾科學·心靈》雜誌十一月/十二月特刊也同樣突出了程式碼與思想之間的聯絡,以此來描繪未來更數字化的您。
“你知道我的方法,華生。”——夏洛克·福爾摩斯
關於支援科學新聞事業
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞事業 訂閱。透過購買訂閱,您將幫助確保未來能夠繼續創作關於塑造我們當今世界的發現和思想的具有影響力的報道。
即使是對計算機技術只有一般興趣的人也可能聽說過 沃森,這是IBM開發的第三代計算系統,它因在電視智力競賽節目“Jeopardy!”中擊敗兩位精英選手而聲名鵲起。許多人可能不知道的是,這臺計算機的能力,包括自然語言處理、假設生成和機器學習,可能會從根本上改變人類與計算機互動的方式,並徹底改變醫療保健的交付方式
在世界各地。在一個突出的例子中,計算機的力量為患者帶來了最好的醫療,休斯頓的MD安德森癌症中心的醫生正在使用沃森來驅動一個名為腫瘤學專家顧問的軟體工具,該工具既可以作為執業臨床醫生的即時參考手冊,也可以作為虛擬專家顧問。最終,它可以在全國各地的醫療中心,甚至在缺乏癌症治療專業知識的地方,為個體癌症患者提供最佳治療方案。
沃森:優秀的對話者
沃森與高階搜尋引擎(如谷歌),甚至與IBM的另一個系統“深藍”(第一個擊敗世界象棋冠軍的計算機系統)有何不同?首先,沃森被設計用來回答以自然、會話式語言向其提出的問題。這在醫學領域尤為重要,因為相關但經常被忽視的病例記錄或資料嵌入在臨床醫生的報告中。然而,即使在已發表文獻和共識指南中通常使用的更嚴格定義的詞彙表中,也可能出現歧義,這限制了第二代計算機為臨床醫生處理和分析相關資料的能力。這些語言歧義是公認的,以至於已經建立了生物醫學本體論等整個研究領域,以幫助闡明給定主題領域內術語的含義和關係。
例如,基因本體論聯盟代表著一項寶貴的努力,旨在為遺傳學中的大資料帶來秩序,規範跨物種和資料庫的基因和基因產物屬性的表示,並提供受控的術語詞彙表。1 本質上,遺傳學研究人員的這項合作旨在為不同的術語建立明確的“含義”,因為即使在專家領域內也可能出現歧義。該聯盟已經闡明瞭超過34萬個物種的遺傳詞彙,而這種嚴格的術語定義對於第二代計算程式的可訪問性至關重要。但是,如果我們超越更嚴格的專家領域,只看“基因”這個詞呢?這個看似簡單的術語可能有不同的定義:一個基因組資料庫可能將基因定義為“可以轉錄和翻譯成蛋白質的DNA片段”,而其他資料庫可能將其定義為“具有名稱並攜帶遺傳特徵或表型的生物學意義的DNA區域”。2 在這個例子中,術語的上下文對於正確的分析至關重要,而正是評估這種上下文的能力使沃森與第二代計算機區分開來。
一臺對母親的擔憂“敏感”的計算機
如果嚴格定義或編碼的醫學術語的處理對當前的計算系統構成了挑戰,那麼非結構化臨床醫生報告的整合則代表了完全不同的難度級別。請考慮以下兩位母親與兒科醫生對話的假設記錄
“母親注意到她的兒子非常聰明和敏感,但即使只是進行輕鬆閱讀,也很難集中注意力完成課堂以外的功課。”
“母親說她的孩子似乎對光敏感,並表示當陽光非常強烈時,他甚至不會到外面去和其他孩子玩,直到太陽快要落山的時候。”
很少有人會難以理解這些筆記,即使它們包含幾個相同的詞語具有不同但相關的含義(多義詞)的例子,包括“敏感”、“聰明”、“外面”、“落山”和“光”。大多數人也不會對“聰明的兒子”和“明亮的太陽”感到困惑,也不會不確定第二句話中的“太陽快要落山”是指“太陽”還是“外面”。許多人甚至可能會在第一句話中感覺到一絲防禦性的驕傲,因為這位母親在表達她的擔憂之前,先評論說她的兒子聰明而敏感。然而,對於大多數計算系統來說,這種會話歧義幾乎是理解人類意圖和意義的不可逾越的障礙。但沃森並非如此。雖然它無法評估母親談話中微妙的情感基調,但沃森確實有能力處理自然語言,並且對母親的預期含義“敏感”。
沃森天才的根源
沃森可以使用與人腦相似的過程來提取自然語言的含義。我們不會隨身攜帶一本巨大的字典,查閱我們聽到的每個單詞的定義,並一絲不苟地拼湊出給定表達的綜合含義。我們也不僅僅依靠一套語法規則來確定含義。事實上,人類經常違反語法、拼寫和語義表達的正式規則,但我們仍然非常擅長理解別人想說什麼。我們透過推理他們的表達方式的語言學,同時還利用我們共同的歷史背景來解決歧義、隱喻和習語。沃森使用類似的技術來確定我們詢問的意圖。
作為此過程的第一步,沃森會攝取大量的文獻——例如已發表的關於乳腺癌治療的參考文獻——這些文獻作為關於給定主題領域或領域的資訊基礎。這些文獻可以以各種數字編碼格式提供,包括HTML、Microsoft Word或PDF,然後由沃森“整理”——驗證該語料庫中包含的資訊的相關性和正確性,並剔除任何具有誤導性或不正確的資訊。例如,一位受人尊敬的研究人員關於乳腺癌的臨床講座對於評估手術策略非常有價值,除非它是在1870年發表在《英國醫學雜誌》上的,並且指出乳房切除術是最有希望的選擇。3 一個世紀後,乳腺癌專家的共識宣告將與評估非手術治療方案相關,除非它是在20世紀90年代末引入關鍵單克隆抗體(如赫賽汀和利妥昔單抗)之前發表的。沃森的工作是將這些已發表的建議置於適當的上下文中。
攝取過程還準備了內容,以便在系統中更有效地使用。一旦內容被攝取,就可以訓練沃森識別該領域的語言模式,然後認知系統透過在問題和從資訊語料庫中產生的候選答案之間進行推斷,來針對該內容回答問題。沃森使用許多不同的演算法來檢測這些推斷。例如,如果問題暗示了任何關於時間範圍的資訊,沃森的演算法將評估候選答案是否與該時間範圍相關。同樣,如果問題暗示了任何關於位置的資訊,演算法將評估相對於該位置的候選答案。它還會考慮問題和潛在答案來源的上下文。它評估問題要求的答案型別(稱為詞彙答案型別),以確保候選答案可以滿足它。對於已知的主題、條件從句、同義詞、時態等也是如此。
沃森對每個特徵進行評分,以指示在問題和候選答案之間可以找到推斷的程度。然後,一種機器學習技術使用所有這些分數來決定特徵的組合在多大程度上支援該領域內的答案。4 沃森本質上是經過訓練來識別相關語言推斷模式的。這種訓練體現在其對候選答案的置信度評分中。沃森也可以根據需要進行重新訓練,以反映領域語言模式的變化。
系統按置信度級別對候選答案進行排序,如果置信度級別超過指定的最低閾值,則提供答案。這與經典人工智慧 (AI) 技術截然不同,因為經典人工智慧技術的含義是從實際語言模式中推匯出來的,而不是僅僅依賴於基於受固定關係約束的受控詞彙表的規則。結果是一個系統,其效能水平比經典人工智慧系統高得多。
改善癌症護理
前沿的癌症療法吸引了頭條新聞,人們不得不驚歎於過去十年腫瘤學研究取得的進展。不幸的是,只有相對較少的患者能夠在MD安德森等專業癌症中心獲得先進的治療方案。大多數人接受的癌症護理效果遠不如前者,甚至根本沒有護理。此外,即使是最專注的專家也無法跟上不斷擴大的醫學文獻的步伐。為了填補這些醫療保健缺口,MD安德森的醫生和計算機科學家開發了MD安德森腫瘤學專家顧問(TM)認知臨床決策支援系統 (OEA(TM)),該系統的實現得到了Jynwel慈善基金會向MD安德森“登月計劃”捐贈5000萬美元的支援。OEA(TM) 將MD安德森醫生的臨床專業知識和經驗與臨床試驗的結果以及醫學專家的已發表研究和共識指南相結合,從而為個體患者提出最佳治療方案。
具體而言,沃森首先攝取然後分析患者護理的全面摘要,這些摘要涵蓋一段時間內以及各種實踐,包括症狀、診斷、實驗室和影像學檢查以及治療史。這些資訊被輸入到軟體中,該軟體將該患者與其他患者進行比較,並將人群劃分為根據其對個體治療的最可能反應定義的群體。然後,沃森捕獲和分析標準護理實踐、該領域臨床醫生的專業知識、佇列研究(比較不同患者人群隨時間推移以評估給定疾病的風險因素)以及臨床文獻中的證據,以評估和排序臨床醫生要考慮的各種治療方案。它將這些資料與患者當前和以前的病情進行匹配,並揭示患者的最佳治療方法。醫生可以檢視沃森治療建議的所有基礎資料,從而讓他們判斷資料的臨床相關性並做出自己的治療決策。換句話說,沃森不會規定治療方案,而是為醫生提供他們為每位患者量身定製治療方案所需的工具。“腫瘤學專家顧問(TM)”目前正在MD安德森進行白血病治療的試點研究,預計將擴充套件到其他癌症以及糖尿病等慢性病。
將大型計算系統視為“人性化”醫療保健的一種手段似乎有悖常理,但透過其理解大量資料的能力,“腫瘤學專家顧問(TM)”代表著朝著真正個性化醫療邁出的重要一步。它不僅將使少數能夠負擔得起精英護理或居住在三級護理中心車程範圍內的人受益。我們相信,沃森最終將為世界各地的患者帶來高質量、循證醫學,而無論其經濟或地域限制如何。醫療保健的這種民主化可能被證明是沃森最持久的貢獻。
參考文獻
1. www.geneontology.org
2. Gangemi A, Pisanelli DM, Steve G. 理解多義醫學術語中的系統概念結構。Proc AMIA Symp. 2000:285-9。
3. Savoy WS. 關於乳腺癌切除術治療的臨床講座。Br Med J. 1870 Mar 12;1(480):255-6。
4. Ferrucci DA. “這就是沃森”導言。《IBM研究與開發雜誌》。第54卷,第3.4期,2012年5月-6月:1-15。
>>系列下一篇:“心靈的哈勃望遠鏡”