眼睛被譽為心靈的窗戶,但谷歌的研究人員認為眼睛是個人健康的指標。這家科技巨頭正在使用深度學習來分析視網膜照片,從而預測一個人的血壓、年齡和吸菸狀況。谷歌的計算機從血管的排列中收集線索,一項初步研究表明,這些機器可以利用這些資訊來預測某人是否面臨即將發生心臟病的風險。
這項研究依賴於卷積神經網路,這是一種深度學習演算法,正在改變生物學家分析影像的方式。科學家們正在使用這種方法來尋找基因組中的突變,並預測單個細胞佈局的變化。谷歌的方法在8月份的一篇預印本中有所描述(R. Poplin et al. 預印本,網址: https://arxiv.org/abs/1708.09843; 2017),是新一波深度學習應用浪潮的一部分,這些應用使影像處理變得更容易、更通用,甚至可能識別出被忽視的生物學現象。
“在以前,將機器學習應用於生物學的許多領域是不現實的,”谷歌研究部門位於加利福尼亞州山景城的工程主管菲利普·納爾遜說。“現在你可以了——但更令人興奮的是,機器現在可以看到人類可能沒有看到的東西。”
支援科學新聞報道
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保有關塑造我們當今世界的發現和想法的具有影響力的故事的未來。
卷積神經網路使計算機能夠高效且全面地處理影像,而無需將其分割成部分。這種方法在2012年左右在科技領域興起,這得益於計算機 power 和儲存技術的進步;例如,Facebook 使用這種型別的深度學習來識別照片中的面孔。但科學家們很難將這些網路應用於生物學,部分原因是不同領域之間的文化差異。“找一群聰明的生物學家,把他們放在一間滿是聰明的計算機科學家的房間裡,他們會用兩種不同的語言交談,並且有不同的思維模式,”卡利科的首席計算官達芙妮·科勒說,卡利科是一家生物技術公司,總部位於加利福尼亞州舊金山,由谷歌的母公司 Alphabet 支援。
科學家們還必須確定可以使用哪些型別的研究,這些研究需要使用大量的影像集進行訓練,然後才能開始進行預測。當谷歌想使用深度學習來尋找基因組中的突變時,其科學家們不得不將 DNA 字母鏈轉換成計算機可以識別的影像。然後,他們用與參考基因組對齊的 DNA 片段以及已知突變的 DNA 片段來訓練他們的網路。最終的結果是 DeepVariant,這是一個於 12 月釋出的工具,可以找到 DNA 序列中的微小變異。在測試中,DeepVariant 的效能至少與傳統工具一樣好。
位於華盛頓州西雅圖市艾倫細胞科學研究所的細胞生物學家正在使用卷積神經網路將用光學顯微鏡捕獲的細胞平面灰度影像轉換為 3D 影像,在這些影像中,細胞的某些細胞器被標記為彩色。這種方法消除了對細胞進行染色處理的需要——染色處理需要更多的時間和複雜的實驗室,並且會損壞細胞。上個月,該小組公佈了一項先進技術的細節,該技術可以使用少量資料(例如細胞輪廓)來預測更多細胞部分的形狀和位置(G. R. Johnson et al. 預印本,bioRxiv http://doi.org/chwv; 2017)。
“你現在看到的是機器學習在完成與成像相關的生物學任務方面取得了前所未有的轉變,”麻省理工學院和哈佛大學博德研究所成像平臺主管安妮·卡彭特說。2015 年,她的跨學科團隊開始使用卷積神經網路處理細胞影像;現在,卡彭特說,這些網路處理了她中心約 15% 的影像資料。她預測,這種方法將在幾年內成為該中心的主要處理模式。
其他人最興奮的是,使用卷積神經網路分析影像可能會無意中揭示微妙的生物學現象,從而促使生物學家提出他們以前可能沒有考慮過的問題。“科學中最有趣的短語不是‘尤里卡!’,而是‘這很奇怪——發生了什麼?’”納爾遜說。
艾倫研究所執行主任裡克·霍維茨說,這種意外的發現可能有助於推進疾病研究。他說,如果深度學習能夠揭示單個細胞中癌症的細微標記,那麼它可能有助於改進研究人員對腫瘤進展的分類。這反過來可能會引發關於癌症如何擴散的新假設。
生物學領域的其他機器學習鑑賞家已將目光投向新的前沿領域,現在卷積神經網路正在影像處理領域起飛。“成像很重要,但化學和分子資料也很重要,”德國環境健康研究中心位於諾伊赫貝格的計算生物學家亞歷克斯·沃爾夫說。沃爾夫希望調整神經網路,使其能夠分析基因表達。“我認為未來幾年將會有非常大的突破,”他說,“這將使生物學家能夠更廣泛地應用神經網路。”
本文經許可轉載,並於 2017 年 1 月 3 日首次發表。
