IBM 曾大力宣傳其沃森超級計算機為癌症治療領域的革命。但事實遠非如此

在 IBM 開始銷售 Watson for Oncology,旨在向醫生推薦癌症治療方案三年後,它未能達到 IBM 為其設定的崇高期望

即使對於一家歷史悠久的美國公司來說,這也是一項大膽的嘗試:IBM 希望憑藉一臺機器,解決人類最棘手的疾病並徹底革新醫學。

IBM 不遺餘力地推廣其標誌性品牌——沃森——試圖抓住世界的想象力,並迅速將目標鎖定在一個備受矚目的領域:癌症。

但在 IBM 開始銷售沃森,旨在向全球醫生推薦最佳癌症治療方案三年後,STAT 的一項調查發現,這臺超級計算機並未達到 IBM 為其設定的崇高期望。它仍在努力學習不同形式的癌症的基本步驟。只有少數幾十家醫院採用了該系統,這與 IBM 在數十億美元市場中確立主導地位的目標相去甚遠。而在國外醫院,醫生們抱怨說,它的建議偏向於美國患者和治療方法。


關於支援科學新聞報道

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道: 訂閱。透過購買訂閱,您將有助於確保未來能夠繼續刊登關於塑造我們當今世界的發現和想法的具有影響力的報道。


STAT 調查了沃森腫瘤學的應用、營銷和在世界各地醫院(從韓國到斯洛伐克再到南佛羅里達州)的效能。記者採訪了數十名醫生、IBM 高管、人工智慧專家以及其他熟悉該系統底層技術和推廣情況的人士。

訪談表明,IBM 為了提振不斷下滑的收入,匆忙推出了一款產品,但並未充分評估在全球醫院部署該產品所面臨的挑戰。雖然 IBM 大力宣傳 沃森用於癌症治療,但 IBM 尚未發表任何科學論文來證明該技術對醫生和患者的影響。因此,它的缺陷正在醫療一線被醫生和研究人員揭露,他們表示,該系統在某些方面前景廣闊,但仍未得到充分開發。

“沃森腫瘤學仍處於蹣跚學步的階段,我們必須等待並積極參與,希望能幫助它健康成長,”韓國癌症專家姜泰佑醫生(Dr. Taewoo Kang)說,他曾使用過該產品。

沃森腫瘤學的核心在於使用基於雲的超級計算機來消化海量資料——從醫生筆記到醫學研究再到臨床指南。但其治療建議並非基於其自身從這些資料中獲得的洞見。相反,它們完全基於人類監督員的培訓,這些監督員費力地向沃森輸入關於具有特定特徵的患者應如何治療的資訊。

IBM 高管承認,沃森腫瘤學 已經開發了近六年,仍處於起步階段。但他們表示,它正在迅速改進,並指出到年底,該系統將為佔全球病例 80% 的 12 種癌症提供治療指導。他們表示,這節省了醫生的時間,並確保患者獲得高質量的護理。

“我們看到有患者說,‘它給了我安心感’,”沃森健康總經理黛博拉·迪桑佐(Deborah DiSanzo)說。“這讓我們感到非常欣慰,我們所做的事情將為患者及其醫生帶來改變。”

但與 IBM 將沃森描繪成數字神童相反,這臺超級計算機的能力是有限的。

也許最令人震驚的誇大之處在於該公司聲稱沃森腫瘤學可以透過人工智慧篩選大量資料來產生新的見解,並識別出,正如一位 IBM 銷售代表所說的那樣,“甚至是癌症治療的新方法”。STAT 發現,該系統不會創造新知識,並且僅在最基本的意義上是人工智慧。

雖然沃森透過贏得電視智力競賽節目《危險邊緣!》而家喻戶曉,但它的程式設計類似於另一種遊戲機:機械土耳其人,一種 18 世紀的國際象棋機器人,它曾讓觀眾眼花繚亂,但卻隱藏著一個秘密——一個躲藏在裡面的操作員。

就沃森腫瘤學而言,那些人類操作員是美國一家醫院——紀念斯隆-凱特琳癌症中心(Memorial Sloan Kettering Cancer Center)——的幾十名醫生,儘管這家醫院備受尊敬。那裡的醫生有權將自己的建議輸入沃森,即使支援這些建議的證據很薄弱。

公眾甚至一些使用沃森腫瘤學的醫院,對該系統的實際能力並不瞭解。資料工程師和醫生花費了近六年時間進行艱苦的工作,才訓練沃森掌握了僅七種癌症的知識,並使該系統與最新的知識保持同步。

“更新一直很困難,我實話實說,”紀念斯隆-凱特琳的首席沃森培訓師馬克·克里斯醫生(Dr. Mark Kris)說。他指出,在一次癌症會議的研究報告展示之後,全球每位轉移性肺癌患者的治療指南最近在一週內發生了變化。“改變認知計算系統並不能像那樣立即轉變,”他說。“你必須輸入文獻,你必須輸入病例。”

沃森的誕生源於 IBM 將自身從一家老牌硬體公司轉型為一家在雲端和人工智慧前沿領域運營的公司的努力。儘管沃森被應用於銀行業到製造業等一系列行業,但它未能結束 IBM 連續 21 個季度收入下滑的頹勢。在最近一個季度,IBM 的認知解決方案部門(以沃森為核心,本應是其業務的未來)的收入甚至較去年同期有所下滑。

針對 STAT 的問題,IBM 表示,沃森在醫療保健和其他領域仍然處於上升軌道,“並且已經是其 200 億美元分析業務的重要組成部分”。醫療保健是沃森企業的重要組成部分。IBM 在其沃森健康部門僱用了 7,000 名員工,並將該行業視為未來幾年 2000 億美元的市場。該公司認為,只有金融服務業的市場機遇更大,達到 3000 億美元。

在這臺超級計算機的效能中,利害攸關的不僅僅是一家著名全球公司的命運。在醫學領域,沃森也是某種數字金絲雀——利用人工智慧來確定預防和治療疾病的最佳方法的、最引人注目的嘗試。IBM 高管表示,該系統更大的目標是普及醫療知識,使每位患者,無論其地理位置或收入水平如何,都能夠獲得最佳的醫療護理。

但在癌症治療領域,對烏托邦式理想的追求已經動搖。

STAT 的調查重點是沃森腫瘤學,因為該產品在臨床護理方面進展最快,儘管沃森也銷售單獨的軟體包來分析基因組資訊並將患者與臨床試驗相匹配。它還在將沃森應用於其他任務,包括磨練 預防醫學實踐 和閱讀 醫學影像

各醫院對沃森腫瘤學的依賴程度各不相同。專家較少的機構更依賴其建議,而其他機構則將該系統降級為後臺角色,就像一位主要技能是研究現有知識的律師助理。

醫院為沃森腫瘤學和超級計算機支援的其他產品支付每位患者的費用。根據迪桑佐的說法,費用金額取決於醫院購買的產品數量,每位患者的費用在 200 美元到 1,000 美元之間。該系統有時附帶諮詢費用,並且與電子病歷系統連線的成本很高。在沒有將其與醫療記錄連線的醫院,必須花費更多時間輸入患者資訊。

在佛羅里達州的朱庇特醫療中心(Jupiter Medical Center),這項任務落在了護士珍·湯普森(Jean Thompson)身上,她每週花費大約 90 分鐘向機器輸入資料。一旦她完成這項工作,她就會點選“詢問沃森”按鈕,以獲得超級計算機為患者提供的治療建議。

在最近的一個上午,一位 73 歲的肺癌患者的檢查結果令人失望:沃森推薦了一種化療方案,而腫瘤學家們已經標記了這種方案。

“還不錯,”腫瘤內科醫生蘇賈爾·沙阿醫生(Dr. Sujal Shah)在與同事討論病例時評價沃森的治療建議。

他後來表示,沃森提供的背景資訊(包括醫學期刊文章)很有幫助,讓他更有信心使用特定的化療方案是明智的。但該系統並沒有直接幫助他做出決定,也沒有告訴他任何他不知道的事情。

朱庇特是美國僅有的兩家採用沃森腫瘤學的醫院之一。該系統在印度和東南亞產生了更多業務。這些國家的許多醫生表示,沃森正在節省時間,並幫助更多患者獲得高質量的醫療護理。但他們也表示,由於醫療實踐和經濟環境的差異,其準確性和整體價值受到限制。

儘管 IBM 進行了鋪天蓋地的營銷宣傳,多年來推出了由塞雷娜·威廉姆斯(Serena Williams)、鮑勃·迪倫(Bob Dylan)和喬恩·哈姆(Jon Hamm)等名人代言的沃森商業廣告,但該公司高管並非總是讚不絕口。在接受 STAT 採訪時,他們承認該系統面臨挑戰,需要更好地與電子病歷系統整合,並需要更多真實患者的資料來尋找模式並提出前沿治療方案。

“隨著沃森變得更智慧,目標是讓它以更自動化的方式提出一些建議,以便在有希望的治療方案出現時,能夠提示‘現在可能是時候了,讓我們撥動開關’,”前 IBM 衛生部門副主管安德魯·諾登醫生(Dr. Andrew Norden)說,他於 8 月初離開了公司。“正如我所描述的那樣,你可能會感覺到這真的很難且細緻入微。”

這種細緻入微之處在 IBM 為推銷沃森而精心構建的敘事中是缺失的。

正是出於設計,目前還沒有一項獨立的第三方研究來檢驗沃森腫瘤學是否能夠實現其承諾。IBM 尚未將該產品提交給外部科學家進行批判性審查,也未進行臨床試驗來評估其有效性。

公司在早期避免外部審查並非聞所未聞,但 IBM 的情況不同尋常,因為沃森腫瘤學並非處於開發階段——它已經在世界各地部署。

韓國風險投資家和研究人員崔允燮(Yoon Sup Choi)撰寫了一本關於人工智慧在醫療保健領域應用的書,他表示,監管機構並未要求 IBM 在韓國或美國銷售該系統之前進行臨床試驗。而且,鑑於醫院已經在使用該系統,臨床試驗不太可能改善業務前景。

“風險太大了,對吧?”崔允燮說。“如果臨床試驗的結果不太好——[如果]沃森帶來的臨床益處微乎其微——這對整個 IBM 來說都是非常糟糕的訊息。”

威斯康星大學法學院的法律和生物倫理學教授皮拉爾·奧索里奧(Pilar Ossorio)表示,沃森應該受到更嚴格的監管,因為它在治療患者方面發揮著作用。“從倫理角度和科學角度來看,你應該在這樣做之前證明其安全性和有效性,”她說。

諾登駁斥了 IBM 應該在商業化沃森之前進行臨床試驗的說法,他指出,醫學領域的許多實踐都被廣泛接受,即使它們沒有隨機對照試驗的支援。

“有沒有人對跳傘運動員的降落傘進行過隨機試驗?”諾登問道。“答案當然是沒有,因為存在非常強烈的直覺價值主張。……所以我相信,將最佳資訊用於醫療決策是無需動腦筋的事情。”

IBM 在其宣告中表示,它已與研究界合作,並在行業會議和同行評審期刊上展示了關於沃森的資料。一些醫生表示,他們不需要看到更多研究就知道該系統很有價值。“人工智慧將在未來的所有醫學領域得到採用,”韓國嘉泉大學吉爾醫療中心(Gachon University Gil Medical Center)沃森專案負責人李恩醫生(Dr. Uhn Lee)說。“如果這種趨勢、這種變化是不可避免的,那麼我們為什麼不早點開始呢?”

到目前為止,關於沃森腫瘤學的研究僅為會議摘要。完整的研究結果尚未在同行評審期刊上發表——而且每一項研究(除了一項)要麼是由付費客戶進行的,要麼作者名單中包含 IBM 員工,或者兩者兼而有之。大多數研究都宣揚積極的結果,表明沃森節省了醫生的時間,並且與他們的治療建議具有很高的符合率。

“符合率”研究構成了關於沃森腫瘤學的大部分公開研究。醫生會要求沃森就大量患者的治療提出建議,然後將其建議與腫瘤學家的建議進行比較。在丹麥一項未發表的研究中,一致率約為 33%——因此該醫院決定不購買該系統。在其他國家,某些癌症的一致率可能高達 96%。但表明沃森與醫生意見一致,只證明了它在應用現有治療方法方面是 competent 的,而不是它可以改進它們。

IBM 高管表示,他們正在進行研究,以檢驗對醫生和患者的影響,但迄今為止尚未完成任何研究。

關於沃森的質疑已經開始進入公眾視野,包括最近一篇 Gizmodo 的報道,標題為“為什麼每個人都討厭 IBM 沃森——包括那些幫助它誕生的人”。最突出的失敗發生在去年 2 月,當時德克薩斯大學 MD 安德森癌症中心(MD Anderson Cancer Center)取消了與沃森的合作關係。

MD 安德森聯盟基本上是沃森在醫療保健領域的 早期面孔。這家休斯頓醫院是 IBM 最早的合作伙伴之一,它正在使用該系統建立自己的專家腫瘤學顧問,類似於 IBM 與紀念斯隆-凱特琳癌症中心合作開發的顧問。但該專案因內部指控超支、延誤和管理不善而解體。總而言之,MD 安德森花費了三年多的時間和 6000 萬美元——其中大部分用於外部顧問——最終擱置了這項工作。

該醫院拒絕回答問題。但專案負責人琳達·秦醫生(Dr. Lynda Chin)在她就此事接受的首次媒體採訪中,向 STAT 講述了她面臨的挑戰。秦醫生在專案崩潰前離開了 MD 安德森;隨後的審計指出,在她領導下存在多項違反採購規定的行為。

秦醫生表示,沃森是一項強大的技術,但將其應用於醫療保健領域極其困難。她和她的團隊遇到了許多障礙,其中一些障礙 IBM 尚未在 MD 安德森或其他地方完全解決。

這家癌症醫院面臨的第一個主要挑戰是讓機器處理醫療記錄的特殊性:首字母縮略詞、人為錯誤、速記短語和不同的書寫風格。“教會機器閱讀記錄比任何人想象的都要困難得多,”她說。她的團隊花費了無數小時來解決這個問題,試圖讓沃森從醫療記錄中提取有價值的資訊,以便將其應用於其建議。

秦醫生表示,她的團隊還在臨床實踐中部署該系統方面遇到了困難。沃森,即使在醫生的指導下,也已經非常接近於讓機器幫助決定向人類提供的治療方案。這帶來了一些棘手的問題,例如如何測試數字治療顧問的安全性,如何確保其符合法規,以及如何將其納入醫生和護士的日常工作。

“重要的是,”秦醫生說。“我們如何建立一個能夠確保醫學中最重要原則的環境:不傷害?”

最後,該專案遇到了一個更大的障礙:即使你能讓沃森理解患者變數並提出 competent 的治療建議,你如何讓它訪問足夠多的、來自足夠多不同來源的患者資料,從而獲得可以顯著提高護理標準的見解?

秦醫生表示,這是一個決定性因素。沃森沒有一個由機構組成的網際網路絡來提供關於特定患者群組的資料。“你可能有 10,000 名肺癌患者。但當你仔細思考時,這個數字仍然不是很大,”她說。

秦醫生說,如果擁有更多患者的資料,你就可以看到模式——“對某種療法有反應的[患者]亞群,沒有反應的亞群,具有某種毒性的亞群。這種模式將有助於更好地實現個性化和精準醫療。但如果我們實際上無法找到一種方法來聚合它們,我們就無法實現這一目標。”

IBM 告訴 STAT,秦醫生的工作與建立沃森腫瘤學的努力是分開的,沃森腫瘤學在部署之前已獲得紀念斯隆-凱特琳癌症中心的癌症專家的驗證。該公司表示,沃森腫瘤學可以從患者記錄中提取和總結大量文字,但這些資訊必須經過臨床醫生的驗證,並且該公司在獲取更多資料以提高沃森的效能方面取得了重大進展。該公司提到了與醫療保健出版商愛思唯爾(Elsevier)和分析公司 Doctor Evidence 的合作關係。

迄今為止,五大洲的 50 多家醫院已與 IBM 或中介技術公司達成協議,使用沃森腫瘤學來治療患者,其他醫院也在使用基因組學和臨床試驗產品。

但與紀念斯隆-凱特琳癌症中心的合作,以及由此產生的產品的推廣,導致了一些複雜情況,IBM 透過仔細措辭的宣告和具有誤導性的營銷手段掩蓋了這些情況。

在其新聞稿中,IBM 讚揚 紀念斯隆-凱特琳癌症中心作為沃森的唯一培訓者的角色。畢竟,誰比世界上最著名的癌症醫院之一的醫生更適合教育該系統呢?

但幾位醫生表示,紀念斯隆-凱特琳癌症中心的培訓將偏見注入了該系統,因為其輸入沃森的治療建議並不總是符合世界各地其他醫生的實踐。

在相同的臨床情況下,醫生可能會——而且經常會——對最佳治療方案、是建議手術還是化療,還是另一種治療方式存在分歧。對於初始治療失敗後給予的二線和三線治療,這些差異尤其大,因為這些治療的益處證據較少,共識也更難達成。

IBM 高管在營銷材料和採訪中,並沒有承認這種困境,而是試圖淡化它。在接受 STAT 採訪時,沃森健康主管迪桑佐駁斥了紀念斯隆-凱特琳癌症中心的參與會造成任何偏見的觀點。

“我們擁有的海量資料消除了偏見,”她說,她指的是輸入沃森的患者病例以及數百萬篇文章和研究。

但這誤解了沃森腫瘤學的工作原理。(IBM 後來聲稱迪桑佐指的是一般的沃森。)

該系統本質上是紀念斯隆-凱特琳癌症中心的行動式版本。其治療建議完全基於醫生的培訓,這些醫生決定沃森需要哪些資訊來制定其指導,以及這些建議應該是什麼。

當用戶向沃森尋求建議時,該系統還會搜尋已發表的文獻——其中一些文獻由紀念斯隆-凱特琳癌症中心策劃——以提供相關的研究和背景資訊來支援其建議。但該建議本身來源於醫院醫生的培訓,而不是外部文獻。

紀念斯隆-凱特琳癌症中心的醫生承認他們對沃森的影響。“我們毫不猶豫地插入我們的偏見,因為我認為我們的偏見是基於最接近前瞻性隨機試驗的東西,那就是擁有大量的經驗,”該醫院沃森首席培訓師之一安德魯·賽德曼醫生(Dr. Andrew Seidman)說。“所以這是一種非常直言不諱的偏見。”

賽德曼醫生表示,當證據存在時,醫院會小心地將其培訓建立在臨床證據的基礎上,但當證據不存在時,他們會毫不猶豫地給出建議。“我們希望癌症治療能夠普及化,”他說。“我們不希望那些沒有數千名患者經驗的醫生在治療更罕見的癌症時處於不利地位。我們希望分享這種知識庫。”

在曼哈頓上東區最近一次沃森培訓會議上,程式設計該系統所涉及的緊張關係展露無遺。STAT 旁聽了紀念斯隆-凱特琳癌症中心的醫生(由賽德曼醫生領導)與 IBM 工程師聚集在一起培訓沃森治療膀胱癌的過程。五名 IBM 工程師坐在桌子的一側。坐在他們對面的是三位腫瘤學家——一位專攻外科手術,一位專攻放射治療,還有一位專攻化療和靶向藥物。

討論開始幾分鐘後,一個問題出現了:對於那些癌症在六個療程的化療後仍然持續存在的患者,應該推薦哪種治療方法?在這種情況下,可供選擇的方案往往與支援它們的證據一樣少。沃森應該建議進行根治性手術切除膀胱嗎?外科腫瘤學家蒂姆·多納休醫生(Dr. Tim Donahue)指出,根據他的經驗,這種手術很少能治癒患者,而且與提高生存率無關。

那麼,另一種化療方案聯合放療呢?

當沃森給出建議時,它會將最佳建議用綠色標出,替代方案用橙色標出,不推薦的方案用紅色標出。

但在某些臨床情況下,很難區分這些顏色。

“這是整個遊戲中最難的部分,”放射腫瘤學家瑪麗莎·科爾邁爾醫生(Dr. Marisa Kollmeier)在培訓期間說。“缺乏證據。而且你不知道在沒有證據的情況下,某些東西是否應該用綠色標出。我們沒有隨機試驗來支援每一個決定。”

但擺在他們面前的任務要求醫生們繼續前進。他們確實這樣做了,仔細研究了一系列臨床情況。在某些情況下,大量的證據支援他們的答案。但許多其他情況都屬於灰色地帶,或者被患者偏好的不可避免的不確定性所籠罩。

這次會議是長達數月的過程中眾多會議之一,目的是讓沃森在膀胱癌方面達到最新水平。隨後的會議將涉及向沃森輸入紀念斯隆-凱特琳癌症中心的真實患者病例資料,以便醫生可以透過重複來加強沃森的培訓。

這種培訓並沒有教會沃森將其建議建立在這些患者的結局之上,無論是他們存活、死亡還是比相似患者活得更久。相反,沃森的建議是基於紀念斯隆-凱特琳癌症中心醫生的治療偏好。

在一些使用沃森的機構,IBM 對該癌症中心角色的不明確導致了混亂。有些人似乎認為他們正在獲得來自世界各地醫生的建議。

“正如我們告訴患者的那樣,這就像另一次諮詢,但這是一次全球諮詢,”朱庇特醫療中心胸腔腫瘤科醫療主任 K·亞當·李醫生(Dr. K. Adam Lee)在 STAT 6 月份訪問時說。

“真的是全球性的,”該醫院的腫瘤科護士克里·沃德(Kerri Ward)補充道。“它從 300 種期刊中提取資訊,僅腫瘤學就有 300 種期刊、臨床資料庫、國家臨床資料庫、期刊、教科書,然後斯隆-凱特琳是目前正在輸入臨床[資訊]的機構。”

哈肯薩克經絡健康(Hackensack Meridian Health)執行長羅伯特·加勒特(Robert Garrett)表示,該集團正在使用沃森腫瘤學的一個版本,沃森中的資訊是“全球性的”。

“如果你是一名結腸癌患者,據我所知,他們的資料庫中記錄了全球各地臨床醫生如何治療結腸癌,以及在結腸癌的不同階段,哪種治療方法最有效,”加勒特說。“這就是 IBM 沃森帶來的價值。”

以上說法均未準確描述沃森腫瘤學的工作原理。

幾位在其他國家檢查過沃森的醫生告訴 STAT,紀念斯隆-凱特琳癌症中心的角色讓他們感到擔憂。丹麥和荷蘭的研究人員表示,他們國家的醫院沒有與沃森簽約,因為它過於關注少數美國醫生的偏好。

荷蘭阿姆斯特丹大學醫學中心(Academic Medical Center)的流行病學家和副教授馬丁·範·奧伊恩(Martijn van Oijen)表示,紀念斯隆-凱特琳癌症中心聚集了頂尖專家,但它並沒有壟斷癌症專業知識。“糟糕的是,這是一家以美國為基地的醫院,其方法與其他一些國家的醫院不同,”範·奧伊恩說,他參與了一項評估沃森等技術的國家倡議,並且堅信使用人工智慧來幫助癌症醫生。

在丹麥,一家醫院的腫瘤學家表示,在發現當地醫生僅在約 33% 的病例中同意沃森的意見後,他們已完全放棄該專案。

“我們曾與 [IBM] 進行過討論,他們對國際文獻的看法非常有限,基本上是將過多的重點放在美國研究上,而對大型國際、歐洲和世界其他地區的研究關注不足,”哥本哈根 Rigshospitalet 中心主任萊夫·延森醫生(Dr. Leif Jensen)說,該中心設有腫瘤科。

在醫生在美國接受培訓的國家,或者他們使用與紀念斯隆-凱特琳癌症中心醫生類似的治療指南的國家,沃森腫瘤學可能會有所幫助。臺北醫學大學臺北癌症中心副院長邱仲峰醫生(Dr. Jeng-Fong Chiou)表示,臺灣使用的指南與美國人相同,因此沃森的建議在那裡將很有用,該中心於 7 月開始對患者使用沃森腫瘤學。

但他也表示,美國患者和臺灣患者之間存在差異——他的患者通常接受較低劑量的藥物以最大限度地減少副作用——他的腫瘤學家將不得不根據沃森的建議進行調整。

紀念斯隆-凱特琳癌症中心治療的通常是富裕人群,這並不能反映世界各地人民的多樣性。威斯康星大學法學院教授奧索里奧指出,因此,用於訓練沃森的病例沒有考慮到較貧窮國家患者面臨的經濟和社會問題。

“它將要學習的是種族、性別和階級偏見,”她說。“我們正在將這些社會分層融入其中,並且我們正在使這些偏見變得更加不明顯,甚至更難被人識別。”

有時,沃森給出的建議與醫生們的意見大相徑庭,而原因與科學無關,例如醫療保險。在2017年韓國全球乳腺癌大會上展示的一張海報中,研究人員報告稱,沃森最常為乳腺癌患者推薦的治療方案根本不在國家醫保系統的覆蓋範圍內。

IBM 表示,他們已經召集了一個國際顧問小組,以收集關於沃森表現的反饋。他們還表示,該系統可以進行定製,以反映治療實踐的差異、藥物可及性和財務因素的考量。此外,公司最近還推出了工具,以減少沃森調整所需的時間和成本。

在回覆 STAT 的提問時,紀念斯隆-凱特琳癌症中心表示,國際期刊是他們提供給沃森的文獻資料的一部分,其中包括《柳葉刀》、《歐洲癌症雜誌》、《腫瘤學年鑑》和《英國醫學雜誌》。“正如我們在所有癌症研究領域所做的那樣,我們將繼續觀察和研究沃森腫瘤學系統如何在國際上影響醫療護理,遵循循證醫學的原則,並與 IBM 合作最佳化該系統,”該醫院表示。

一些國外的醫院正在根據當地患者的情況定製該系統,新增有關本地治療方案的資訊。泰國康民國際醫院沃森腫瘤學專案的負責人 Nan Chen 表示,他的腫瘤科醫生在治療胃癌時,使用的是日本的指南,而不是美國的指南。

但他表示,醫生們可能會覺得這種本地化是多餘的或不必要的:他們對被告知那些他們剛剛教給沃森的指導意見並不感興趣。

“我們的醫生說,這種療法是我們自己醫院的療法,我們很清楚,” Chen 說。“你們不需要再把這些療法輸入到沃森中,然後讓沃森來告訴我們,我們醫院正在使用什麼樣的療法。”

然而,Chen 表示,這種改進後的系統非常有用,尤其對於蒙古首都一家沒有聘請任何腫瘤專家的醫院而言。

在 UB Songdo 醫院(Chen 的公司是該醫院的大股東),醫生們幾乎 100% 採納沃森的建議。原本可能由幾乎沒有或根本沒有接受過癌症培訓的全科醫生治療的患者,現在能夠從頂級的專業知識中獲益。

“這正是 IBM 夢寐以求的應用場景,” Chen 說道。

在韓國,釜山國立大學醫院的乳腺癌外科腫瘤專家姜泰宇醫生指出,沃森還需要解決另一個重要問題。目前,它會為其提出的建議提供支援性證據,但實際上並沒有解釋清楚它是如何為特定的患者推薦特定的治療方案的。

姜醫生說,有時他會就一位癌細胞尚未擴散到淋巴結的患者向沃森尋求建議,而沃森卻會推薦一種名為紫杉烷的化療藥物。但他表示,這種療法通常只在癌細胞已經擴散到淋巴結時才會使用。而且,為了支援這項建議,沃森還會展示一項研究,這項研究證明了紫杉烷對於癌細胞已擴散到淋巴結的患者的有效性。

姜醫生對此感到困惑,不明白沃森為何會推薦一種他通常不會用於像他眼前這位患者的藥物。而且沃森也無法解釋原因。

儘管存在種種擔憂,但世界各地一些使用沃森的醫生堅持認為,人工智慧終將徹底變革醫療保健行業。他們表示,臨床醫生正在意識到切實的益處——節省醫生們寶貴的文獻檢索時間,更好地教育患者,並削弱診所中可能妨礙循證治療的等級制度。

在臺灣,邱醫師表示,沃森能夠立即提供關於某種療法的“最佳資料”,例如生存率,從而使醫生們不必再費力檢索文獻來比較各種可能的治療方案。

李醫生(在韓國吉爾醫療中心 負責沃森專案的醫生)表示,沃森的資訊也增強了患者的自主權。以前,醫生只是口頭向患者解釋不同的治療方案。現在,醫生可以給患者提供由沃森準備的綜合資料包,其中包括潛在的治療計劃以及相關的科學文章。患者可以自行研究這些療法,甚至可能在正確的治療方案上與醫生意見相左。

“這是最重要和意義深遠的改變之一,” 李醫生說。

沃森還讓資深醫生對資料負責。在吉爾醫療中心,患者會與五位醫生以及沃森本身(介面顯示在所謂的“沃森中心”的平板電視上)同處一室。李醫生表示,沃森的存在對醫生的決策過程產生了巨大影響,削平了傳統上資深醫生的意見優先於年輕同事的等級制度。

沃森為年輕醫生提供了快速便捷地獲取資料的途徑,這些資料可能證明資深醫生的觀點是錯誤的,螢幕上會顯示生存率等資訊,與推薦的治療方案並列。李醫生說,在這種證據面前,資深醫生如果繼續堅持推行不同的治療方案,將會很丟臉。

在印度的馬尼帕爾醫院,S.P. Somashekhar 醫生表示,雖然沃森對直腸癌和乳腺癌患者的建議存在一些地區差異,但這些病例只是少數例外:對於絕大多數患者,該程式的建議與醫院腫瘤委員會(一個由 20 名醫生組成的團隊,他們通常會研究病例一週,並花費一小時進行討論)給出的建議相符。

這意味著沃森在短短幾秒鐘內完成了 20 位醫生花費一週時間才能完成的工作。“這非常寶貴,價值極高,” Somashekhar 醫生說。“我們的醫生不可能討論每一個病例。對於我們在腫瘤委員會討論的每一個病例,還有五個病例我們無法討論。”

雖然這些益處意義重大,但它們仍未達到能夠預測或根除疾病的突破性發現的程度。

IBM 的高管表示,這並不意味著沃森無法實現這些壯舉。Norden(沃森腫瘤學和基因組學的前任副健康官)表示,最終目標是將臨床試驗資料和真實世界的患者資料彙集在一起,以便沃森能夠開始自行找出最佳治療方案。

“我個人認為,隨著時間的推移,我們將更擅長衡量和報告結果,這些資料的影響力也將越來越大,” 他說。“就目前的癌症治療水平而言,我認為任何計算系統都還沒有準備好在沒有專家人工監督的情況下投入使用。”

對於 IBM 來說,更大的問題不是醫療保健行業是否會迎來人工智慧的革命,而是由誰來推動這場革命。

一位前 IBM 員工表示,該公司可能會成為自身營銷成功的受害者——其設定的不切實際的期望掩蓋了真正的成就。

“IBM 應該停止嘗試治癒癌症,” Peter Greulich(一位前 IBM 品牌經理,曾撰寫多本關於 IBM 歷史和現代挑戰的書籍)說。“他們放任營銷引擎運轉,卻不控制如何構建和製造產品。”

Greulich 表示,IBM 需要在沃森身上投入更多資金,並聘請更多人才,才能使其獲得成功。他說,在 20 世紀 60 年代,IBM 花費了相當於其年收入 11.5 倍的資金來開發其大型計算機,而這項業務至今仍佔其盈利能力的大部分。

如果 IBM 要對沃森進行同等規模的投資,就需要花費 1370 億美元。“它唯一花費了這麼多錢的地方就是股票回購,” Greulich 說。

IBM 表示,他們創造了人工智慧市場,並對沃森的增長速度感到滿意,並指出沃森和其他新興業務部門在過去三年中增長了超過 200 億美元。“Facebook 和亞馬遜用了超過 13 年的時間才增長了 200 億美元,”該公司在一份宣告中表示。

自從沃森在 2011 年的“危險邊緣!”節目中展示其能力以來,數百家公司已經開始使用人工智慧開發醫療保健產品。這些公司包括無數初創企業,但 IBM 也面臨著來自行業巨頭的激烈競爭,例如亞馬遜、微軟、谷歌以及 UnitedHealth 集團旗下的 Optum 部門。

例如,谷歌的 DeepMind 最近展示了其在遊戲方面的實力,使用其 AlphaGo 程式擊敗了圍棋世界冠軍,圍棋是一項擁有 3000 年曆史的中國棋類遊戲。

DeepMind 正在與倫敦的醫院合作,學習檢測眼部疾病並加快頭頸癌靶向治療的流程,儘管他們也遇到了隱私問題

與此同時,亞馬遜也啟動了一個醫療保健實驗室,探索從電子健康記錄中挖掘資料的機會,並有可能構建一個虛擬醫生助手。

金融公司 Jefferies 最近釋出的一份報告指出,IBM 正迅速失去競爭優勢。“IBM 在人工智慧人才爭奪戰中似乎處於劣勢,並且可能會面臨日益激烈的競爭,” 該公司總結道。

雖然該報告並非專門針對沃森的醫療保健產品,但報告指出,潛在客戶正在逐漸遠離該系統,原因是與其部署相關的諮詢費用過高。報告還指出,亞馬遜的職位招聘數量是 IBM 的 10 倍,而 IBM 最近沒有續簽少量為該公司工作的承包商的合同,這些承包商是在 IBM 去年以 26 億美元收購 Truven 公司(為了獲取 1 億患者的病歷)後加入公司的。

IBM 在宣告中表示,這些員工的合同已經到期,並且公司正在繼續積極招聘位於馬薩諸塞州劍橋市的沃森健康部門和其他部門的員工,在美國有超過 5000 個職位空缺。

但那些與沃森腫瘤學系統密切合作的人表示,該系統的前景充滿挑戰。Kris(紀念斯隆-凱特琳癌症中心的首席培訓師)表示,該系統有潛力改善醫療護理,並確保更多患者獲得專家級的治療。但就像醫學生一樣,沃森也只是剛剛開始學習如何在真實世界中發揮作用。

“沒有人想聽到這個,” Kris 說。“他們只想聽到沃森就是答案。它總是能給出正確的答案,而且你能立即得到答案,而且會更便宜。但就像其他任何事物一樣,它也有點像人類。”

STAT 許可轉載。本文最初發表於 2016 年 9 月 5 日

STAT delivers fast, deep, and tough-minded journalism. We take you inside science labs and hospitals, biotech boardrooms, and political backrooms. We dissect crucial discoveries. We examine controversies and puncture hype. We hold individuals and institutions accountable. We introduce you to the power brokers and personalities who are driving a revolution in human health. These are the stories that matter to us all.

More by STAT
© .