人工智慧將幫助科學家提出更強大的問題

自學習系統可以發現海量資料集中的隱藏模式,超越人類自身所能發現的

加入我們的科學愛好者社群!

本文發表於《大眾科學》的前部落格網路,僅反映作者的觀點,不一定代表《大眾科學》的觀點


過去幾個世紀的科學進步不僅加深了我們對宇宙的理解;它們還提高了全球許多人的生活水平。然而,正如氣候變化和 COVID-19 大流行所表明的那樣,我們仍然面臨著許多我們尚未充分應對的巨大挑戰,這些挑戰表明我們尚未理解自然的複雜性。為了解決當前人類面臨的規模龐大的問題,我們需要採取根本性的解決方案——科學突破將是這一過程的核心。人工智慧有望透過深化研究人員可以提出的問題的本質來加速基礎發現。

在他 1945 年發表的富有遠見的文章“As We May Think”中,傑出的美國工程師和科學倡導者範內瓦·布什預測,人們很快就需要依靠外部裝置來增強他們的思維。即使在當時,他也能看到科學發現的速度如此之快,以至於儲存、處理和理解資訊的需求已經超過了人們的生物能力。

他富有遠見的觀察比以往任何時候都更加真實:現代科學的挑戰之一是理解我們收集的關於世界的海量資訊。鑑於科學產生的資料規模——從大型強子對撞機到大型基因組專案——任何個人都不可能解析所有資料。人工智慧有望幫助我們將這些豐富的資訊轉化為理解——使我們能夠提出個人難以解決的問題。


關於支援科學新聞

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。 透過購買訂閱,您正在幫助確保有關塑造我們當今世界的發現和想法的具有影響力的故事的未來。


長期以來,科學家們一直使用計算來推進科學,利用計算機程式來建模和模擬自然系統,以解釋和理解科學現象。這種方法對科學非常有效,並推動了從原子模擬到宇宙模型等一系列進步。然而,這種經典範式受到其對人類程式設計師的依賴性的限制,人類程式設計師必須首先從理論和觀察中提煉規則,然後使用這些規則來編寫程式的行為程式碼。我們的希望是使用人工智慧系統直接從資料或經驗中推匯出此類規則,並有可能超越個體研究人員可能破譯的內容。這些自學習系統可以透過發現海量資料集底層結構的隱藏屬性來探索潛在的解決方案和策略,因此可以增強而非侷限於人類的理解。

因此,關鍵一點是為這些系統找到要探索的正確問題。儘管在科學領域應用人工智慧方面已經做了大量工作,但直接應用這些技術並不一定(或應該)在每個科學問題上都取得突破。最具影響力的進步將來自將人工智慧技術應用於對社會真正重要的問題,以及需要複雜的推理和分析能力的問題。解決問題的藝術很大程度上在於首先選擇正確的問題。因此,關鍵一點是為這些系統找到要探索的正確問題。

例如,生物學中最重要的問題之一是理解蛋白質如何形成其形狀。蛋白質對於身體的健康運作至關重要,並且像細胞內的微型機器一樣發揮作用,以執行許多生命任務。蛋白質的形狀決定了其功能,這就是為什麼如此多的研究小組致力於發現不同蛋白質的結構;一旦蛋白質的形狀已知,研究人員就可以更好地瞭解其工作原理,並篩選在疾病中發生故障時與之相互作用的藥物。碰巧的是,這是人工智慧的完美應用,因為我們有相對較大的已知蛋白質結構資料集可用於訓練系統,並且這是一個我們可以量化進展的問題。

科學家可能花費數年時間使用耗時的實驗方法(如晶體學)來研究單個蛋白質的形狀。與其一次研究一種蛋白質的形狀,不如使用現有資料來教導人工智慧系統如何僅從其氨基酸序列描述來預測任何天然存在的甚至理論上可能的蛋白質的形狀。基於神經科學啟發的學習技術,我們最近釋出的 AlphaFold 模型 可以訓練大型已知蛋白質結構資料集,以預測一維氨基酸鏈如何摺疊成三維形狀。 

使用該系統,我們最近生成了構成 SARS-CoV-2(導致 COVID-19 的病毒)的六種蛋白質形狀的預測。雖然我們的方法預測的結構不會直接帶來治癒方法,但它們可以為研究人員提供有用的提示,以開發可能對抗該病毒的藥物和抗體,並可能增進我們對這種全球健康威脅的理解。 

多年來,許多學術團體在摺疊問題上取得了穩步進展,CASP(一個兩年一度的蛋白質摺疊預測競賽)的準確性提高就證明了這一點。2018 年,AlphaFold 在 CASP13 中榮獲最高榮譽,與上屆比賽的最佳模型相比,準確率提高了 40%。未來,這種方法可以幫助科學家專注於最有希望的線索,節省時間和金錢,例如,在臭名昭著的昂貴藥物開發過程中。透過人工智慧驅動的模擬,可以在計算機上設計新型蛋白質,然後在現實世界中對其進行測試——幫助研究人員更有效地指導研究工作和資金。

這就是人工智慧的魅力所在:它將實現從特殊到一般的抽象,從經驗中提煉出統一的原則。它深化了科學家可以提出的問題的本質:不僅僅是“蛋白質 X 的形狀是什麼?”,更根本的是“任何蛋白質的形狀由什麼決定?” 追問這樣的問題不會只貢獻一個答案,而是許多答案,從而開闢全新的研究領域。

如果我們在預測蛋白質如何形成其形狀方面取得足夠的進展,我們可能會更容易設計出新的藥物、酶和通用疫苗,從而帶來無數的社會效益。同樣,如果我們能使用人工智慧來忠實地模擬原子集合,就有可能合理地設計用於電池、太陽能技術、碳捕獲等的新材料。給定正確的問題、正確的訓練資料和量化學習的能力,人工智慧系統有望加深我們的科學理解並加速新的技術突破。人工智慧不僅僅是自動化影像分類或簡化供應鏈;我們希望用它來發現關於宇宙的新知識,並利用這種理解來改善世界。

© .