本文發表於《大眾科學》的前部落格網路,反映作者的觀點,不一定反映《大眾科學》的觀點
在20世紀80年代初,當他們宣佈“計算藥物設計的黃金時代”時,我還是個蹣跚學步的幼兒。現在我可能還是個幼兒,但我經常從這個領域中帶著迷茫眼神的老兵那裡聽到關於即將到來的黃金時代的故事。《財富》雜誌的一篇封面故事(我似乎永遠無法在網上找到)宣佈,製藥科學家現在正在計算機上設計藥物。其想法是,一旦你輸入藥物在人體內的行為引數,計算機就會簡單地給出答案。唯一的障礙是受硬體和軟體進步限制的計算能力。文章似乎暗示,只要給它足夠的時間,身穿白大褂的實驗室科學家可能會成為歷史的遺蹟。未來看起來一片光明,充滿希望。
快進到2013年的暮年。我們仍在等待計算藥物設計的黃金時代。藥物發現和設計的大部分工作仍然由身穿白大褂的實驗室科學家完成。現在讓我們明確一件事:自20世紀80年代以來,該領域的計算方面取得了巨大進步,並且它仍在蓬勃發展。毫無疑問,總有一天它對藥物設計的貢獻將被視為實質性的。大多數藥物透過與特定蛋白質結合在生物系統中發揮其魔力,而計算藥物設計現在已經足夠勝任,它可以相當準確地預測藥物分子結合在蛋白質深處的結合口袋中的結構和方向。計算科學家現在可以對藥物的結構提出有用的修改建議,實驗室化學家可以進行這些修改以改善多種特性,包括溶解度、跨細胞膜的擴散能力、細胞內的活性以及避免被體內酶分解的能力。你很難找到一個計算建模沒有至少發揮一定作用的藥物設計專案。將今年的諾貝爾化學獎授予計算化學家只是該領域取得多大進展的一個標誌。
然而,計算藥物設計師似乎正面臨著與 80 年代完全相同的基本挑戰。他們在理解這些挑戰方面肯定取得了進展,但可靠的預測仍然是未來的事情。他們正在處理的最重要的問題與 80 年代處理的問題相同:你如何解釋蛋白質-藥物系統中的水?你如何計算熵?你如何預測蛋白質的摺疊結構?你如何計算藥物分子在體內水性環境中採用的不同結構?你如何修改一種藥物化合物,使其能夠抵抗外來分子入侵的細胞不會直接將其排出?你如何預測藥物和蛋白質之間結合能的絕對值?儘管軟體和硬體取得了巨大的、數量級的改進,但科學家們仍在努力解決這些問題。
關於支援科學新聞
如果你喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道: 訂閱。透過購買訂閱,你正在幫助確保有關當今塑造我們世界的發現和想法的具有影響力的故事的未來。
我說這些是因為本月《大眾科學》一篇關於計算材料設計的封面故事讓我感到不安的似曾相識感。這篇文章由兩位科學家撰寫,他們熱情地談論一個專案,該專案的目標是為每種可能的應用列出計算出的材料特性:從汽車中的輕質合金到太陽能電池的新材料,再到將耗散的熱量轉化為電能的熱電材料。作者們確信,我們現在正接近計算材料設計的黃金時代,其中材料特性的高通量預測將使我們至少加快新型材料的製造速度。
我們現在可以利用一個世紀以來在物理學和計算方面的進步,超越愛迪生式的過程(反覆試驗)。計算機處理能力的指數級增長,再加上沃爾特·科恩和已故的約翰·波普爾在 20 世紀 60 年代和 70 年代所做的工作,他們開發了量子力學方程的簡化但精確的解決方案,使得利用超級計算機和第一性原理物理學從頭開始設計新材料成為可能。該技術被稱為高通量計算材料設計,其思想很簡單:使用超級計算機一次虛擬研究數百或數千種化學化合物,快速有效地尋找新材料的最佳構建模組,無論是電池電極、金屬合金還是新型半導體。
這聽起來當然很樂觀。然而,這篇文章似乎大談可能性,卻缺乏實質和缺點。這可能是因為它在雜誌中僅佔三頁;我認為它應該佔用更多的篇幅,尤其是對於封面文章。就目前的情況而言,這篇文章顯得比謹慎的樂觀主義更像是一廂情願。
我讚賞構建計算材料特性資料庫的努力,但我對這種知識在不久的將來如何用於設計新材料持更加悲觀的態度。我不是材料科學家,但我認為該學科的計算端面臨的一些問題與任何計算化學家面臨的問題相似。正如文章指出的那樣,用於材料設計的主要工具是主要由約翰·波普爾和沃爾特·科恩在 20 世紀 70 年代開發的基於量子力學的化學方法,這一發現使兩人獲得了 1998 年的化學諾貝爾獎。從那時起,這些方法就被編碼到數十個高效、使用者友好的計算機程式中。然而,這些方法——儘管它們基於第一性原理——速度卻非常慢。即使有強大的計算能力,也可能需要幾天時間才能對原子晶格進行詳細的量子力學計算。對於涉及數百個原子和擴充套件框架的材料,則需要更長的時間。
我尤其不相信這些方法能夠實現快速、高通量的計算,從而取代實驗的反覆試驗。我感到悲觀的一個原因是預測晶體結構的巨大困難。問題如下:材料的特性取決於其原子在明確的晶格中的幾何排列。根據條件(溫度、壓力、溶劑),材料可以以數十種可能的結構結晶,這使得假設“一個”晶體結構的練習變得徒勞。更糟糕的是,對於計算機計算而言,這些結構之間的能量差異可能很小,在許多理論技術的誤差範圍內。
另一方面,錯誤的晶體結構可能會給我們帶來錯誤的特性。因此,對於任何型別的計算預測方法,其挑戰是雙重的:首先,它必須預測給定材料可以採用的各種可能的晶體形式(有時這個數字可能高達數百個)。其次,即使它能夠實現此列表,它現在也必須按能量順序對這些晶體形式進行排序,並預測哪個將是最穩定的晶體形式。由於各種形式之間的能量差異很小,即使是對單一材料進行詳細計算,這也將是一個嚴峻的挑戰。將溫度、壓力和溶劑條件納入計算將使計算成本更高。在我看來,以高通量的方式對數十或數百種材料進行所有這些工作將是一項充滿延遲和錯誤的努力。這肯定會做出推進該領域的極其寶貴的智力貢獻,但我看不出我們如何能夠接近實際和廉價地使用此類計算來設計複雜的新材料,其速度至少與實驗相當。
我預見的第二個問題是一個常見的問題,幾乎任何科學家或工程師都稱之為多引數最佳化問題。我們在藥物設計領域一直面臨這個問題;我們不僅需要最佳化藥物在細胞內的活性,而且還需要同時最佳化其他關鍵特性,如穩定性、毒性和溶解度,甚至在更高層次上,還需要最佳化非科學特性,如價格和用於製造藥物的起始材料的可用性。最佳化這些特性中的每一個都將是一場艱苦的戰鬥,但同時最佳化所有這些特性(或至少在給定的時間最佳化兩個或多個特性)會耗盡最優秀的科學家和計算機的智慧和資源。我假設新材料也必須滿足類似的多重特性;例如,用於汽車的新合金必須是輕質的、對環境無害的、對熱和光穩定的並且廉價的。藥物發現仍然如此困難的主要原因之一就是這個多引數最佳化問題,我看不出在計算層面上材料科學的情況會有什麼不同,特別是如果大多數技術都涉及昂貴的量子力學計算。
加快計算速度的一種方法——這也是我希望在文章中讀到的——是使用廉價的、基於經典力學的引數化方法。在這些方法中,你可以透過在經典模型中使用來自實驗的引數來簡化問題,該模型透過實驗確定的變數隱式地包含量子效應。雖然這些計算很便宜,但它們也可能導致更大的誤差,儘管對於更簡單的系統,它們幾乎與詳細的量子計算一樣有效。在我看來,他們正在構建的這個屬性資料庫可以透過實驗值來支援,並用於構建引數化的、更便宜的模型,這些模型實際上可以以高通量的能力使用。
所有這些是否讓我對計算材料設計的未來感到悲觀?一點也不;我們才剛剛起步,這個領域需要大量有才華的科學家湧入。計算藥物設計遵循了經典的技術曲線,經歷了過高的期望,隨之而來的是失望的低谷,最終達到了現實評估的平臺期。也許計算材料設計也會發生類似的情況。但我認為說我們正在進入黃金時代是錯誤的。我們可能正在試水,為令人滿意的一躍做好準備。這應該被稱為“試水”,而不是成功地遊過材料的河流。我祝願那些勇於嘗試的人一切順利。