谷歌DeepMind公司已經運用其革命性的蛋白質結構預測人工智慧來尋找導致疾病的基因突變。
一種基於AlphaFold網路的新工具可以準確預測蛋白質中哪些突變可能導致健康問題——這一挑戰限制了基因組學在醫療保健中的應用。
研究人員表示,名為AlphaMissense的人工智慧網路是一個進步,他們正在開發類似的工具,但這不一定是一個巨大的變革。它是正在開發中的眾多技術之一,旨在幫助研究人員,並最終幫助醫生“解讀”人們的基因組,以找到疾病的原因。但像AlphaMissense這樣的工具——在9月19日發表在《科學》雜誌上的一篇論文中有所描述——在臨床應用之前需要經過徹底的測試。
關於支援科學新聞報道
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保關於塑造我們今天世界的發現和想法的有影響力的故事的未來。
許多直接導致疾病的基因突變,例如導致囊性纖維化和鐮狀細胞病的突變,往往會改變它們編碼的蛋白質的氨基酸序列。但研究人員只觀察到數百萬個這樣的單字母“錯義突變”。在人類基因組中超過7000萬個可能的突變中,只有極少一部分被確鑿地與疾病聯絡起來,而且大多數似乎對健康沒有不良影響。
因此,當研究人員和醫生髮現他們以前從未見過的錯義突變時,可能很難理解它的意義。為了幫助解釋這種“意義不明的變異”,研究人員開發了數十種不同的計算工具,可以預測變異是否可能導致疾病。AlphaMissense結合了現有的解決問題的方法,這些方法越來越多地透過機器學習來解決。
定位突變
該網路基於AlphaFold,它可以從氨基酸序列預測蛋白質結構。DeepMind研究副總裁兼研究作者Pushmeet Kohli在新聞釋出會上表示,AlphaMissense並沒有確定突變的結構效應(這是生物學中的一個開放性挑戰),而是利用AlphaFold對結構的“直覺”來識別蛋白質內可能發生致病突變的位置。
AlphaMissense還結合了一種受大型語言模型(如ChatGPT)啟發的神經網路,該網路在數百萬個蛋白質序列而不是單詞上進行了訓練,稱為蛋白質語言模型。這些模型已被證明擅長預測蛋白質結構和設計新蛋白質。DeepMind研究科學家、該研究的共同負責人Žiga Avsec告訴記者,它們對於變異預測非常有用,因為它們已經瞭解哪些序列是合理的,哪些是不合理的。
DeepMind的網路似乎在區分已知會導致疾病的變異和那些不會導致疾病的變異方面優於其他計算工具。它在發現實驗室實驗中發現的問題變異方面也表現良好,這些實驗一次測量數千個突變的影響。研究人員還使用AlphaMissense建立了人類基因組中每種可能的錯義突變的目錄,確定57%的突變可能是良性的,32%的突變可能導致疾病。
臨床支援
斯德哥爾摩大學的計算生物學家Arne Elofsson說,AlphaMissense是預測突變影響的現有工具的進步,“但不是一個巨大的飛躍”。
英國愛丁堡MRC人類遺傳學部門的計算生物學家Joseph Marsh同意,它的影響不會像AlphaFold那樣顯著,AlphaFold開創了計算生物學的新時代。“這令人興奮。它可能是我們目前擁有的最好的預測器。但它會在兩三年內成為最好的預測器嗎?很有可能不會。”
Marsh說,計算預測目前在診斷遺傳疾病中的作用微乎其微,醫生團體的建議稱,這些工具應僅在將突變與疾病聯絡起來時提供輔助證據。Avsec說,AlphaMissense比以前的方法更有信心地對更大比例的錯義突變進行了分類。“隨著這些模型變得更好,我認為人們會更傾向於信任它們。”
佐治亞州亞特蘭大埃默裡大學的生物資訊學家Yana Bromberg強調,像AlphaMissense這樣的工具在應用於現實世界之前,必須使用良好的效能指標進行嚴格評估。
例如,一項名為“基因組解釋關鍵評估(CAGI)”的活動多年來一直在針對尚未釋出的實驗資料,對這種預測方法的效能進行基準測試。“想到醫生在沒有CAGI等實體評估的情況下,就採用預測並像對待真實事物一樣對待它,這是我最可怕的噩夢,”Bromberg補充道。
本文經許可轉載,並於2023年9月19日首次發表於。
