研究人員藉助超級計算尋找瘧疾的弱點

Intellectual Ventures 構建計算機模擬,以更好地瞭解瘧疾的傳播方式以及對根除工作的反應


關於支援科學新聞

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您將有助於確保關於塑造我們當今世界的發現和思想的具有影響力的故事的未來。


瞭解傳染病的細微之處,尤其是瘧疾,該疾病在2008年導致全球約100萬人死亡,是消滅它們的關鍵一步。然而,要清楚瞭解瘧疾如何傳播以及它如何對根除工作做出反應,意味著需要訪問來自各種來源的大量資料,這類工作最適合由一臺資料處理能力強大的超級計算機完成。

超級計算機曾經是少數大學和政府實驗室的特權,但近年來,它們已被重新定義,使其更容易為小型研究實驗室所用。這包括來自華盛頓州貝爾維尤的 Intellectual Ventures 的一個團隊,他們正在利用過去一年投入使用的超級計算機的速度和力量,建立複雜的模擬,他們希望這些模擬能夠揭示覆雜問題的解決方案,包括瘧疾的傳播。

Intellectual Ventures 的超級計算機是一項正在進行的工作,由該組織內的兩個不同的研究團隊共享——一個團隊研究瘧疾(pdf),另一個團隊,名為TerraPower,研究核反應堆技術。瘧疾專案於 2007 年啟動,此前比爾和梅琳達·蓋茨基金會呼籲 Intellectual Ventures 開發新的技術來對抗瘧疾。這促使人們產生了使用計算機模型來模擬該疾病在全球傳播的想法。

該超級計算機由 138 臺戴爾刀鋒伺服器組成,每臺伺服器執行多個處理單元(或核心),總共有 1,104 個核心。Intellectual Ventures 通常將其中 1,024 個核心用於 TerraPower,其餘的用於其瘧疾研究。研究人員選擇 Microsoft Windows 作為其作業系統(Linux 也常用於超級計算叢集),因為他們設施的系統管理員熟悉 Microsoft 軟體。微軟聯合創始人比爾·蓋茨正在投資 TerraPower 和瘧疾專案,並且 Intellectual Ventures 本身是由前微軟高管 內森·米爾沃德愛德華·榮 成立的,這對他們也有所幫助。

該超級計算機擁有 5 太位元組 的記憶體和 30 太位元組的儲存空間,提供了強大的數字處理能力,但如果沒有指導計算機的軟體,這將毫無意義。該軟體提取關於 瘧原蟲 寄生蟲及其攜帶者蚊子的行為和繁殖率的生物學資料,以及關於人類感染模式和免疫反應的資訊。其他資料包括人們居住的地點和旅行方式,對瘧疾傳播很重要的環境因素(溫度、降雨和海拔高度),以及不同種類蚊子的位置。該軟體使用來自各種來源的資料,包括世界衛生組織、瘧疾地圖集專案、大學和 NASA,來建立瘧疾爆發如何發生的模型。

在去年超級計算機投入使用之前,瘧疾專案研究人員使用一臺八核計算機來建立其研究的基礎。然而,他們需要擴充套件他們的計算能力,以便更準確地模擬更大地理區域的疾病。“更大的叢集意味著您可以在相同的時間內模擬更大的區域,”Intellectual Ventures 的研究科學家 菲利普·埃克霍夫說。該團隊使用 蒙特卡洛方法建立其瘧疾模擬,依靠來自重複試驗的資訊來構建結果。因此,訪問更多的核心允許研究人員更快地執行更多的試驗並更快地達到他們的目標試驗次數。

週三下午早些時候,超級計算機正在執行九個不同的研究任務。其中一項任務需要 72 個計算機核心來執行,是對印度潛在的脊髓灰質炎計劃的模擬。該模擬包括有關印度人口(年齡、全國人口分散情況、遷徙模式和人口統計資料)的資訊,並演示了當人們相互互動時,疾病可能如何傳播的場景。“這是一種機率方法,”埃克霍夫說。“有些互動會導致疾病,有些則不會。”

Intellectual Ventures 計劃透過新增節點進一步擴充套件其超級計算機。該公司計算機設施有增長空間,可以容納多達 3,000 個核心,而無需更改設施的電力和冷卻系統。研究人員估計,如果對電力和冷卻進行投資,他們可以擠入多達 6,000 個核心。

在預算範圍內對超級計算能力的需求吸引了通常在較小範圍內運營的科技供應商進入高效能計算領域。微軟(透過其 Windows Azure 平臺)、亞馬遜(透過其 亞馬遜網路服務)和其他公司正在提供“雲”服務,他們使用其龐大的資料中心來託管客戶的資料、軟體和計算資源,客戶透過他們的臺式電腦訪問他們尋求的資訊。

微軟本週早些時候推出了一項計劃,該計劃將特別關注提供託管的高效能計算資源。“我們的理解是,微軟技術計算小組正在努力將‘技術計算’,即超級計算,帶給大眾,”Intellectual Ventures 系統工程師約翰-盧克·佩克說,他指出他公司的超級計算機使用微軟軟體,可以利用並行處理。“他們的解決方案可以並且將會為以前無法獲得的研究人員、學生和其他人帶來機會。”

儘管雲計算已經取得了很多進展,但對於包括 Intellectual Ventures 在內的每個研究小組而言,這都不是一個選擇。構建他們自己的超級計算機的主要原因是他們的一些專案可能具有國家安全意義,這意味著這些資料不能出口到國外(許多服務提供商在國外設有資料中心),Intellectual Ventures 的諮詢物理學家兼 TerraPower 的中子和建模負責人查克·惠特默說。

第二個原因是分散式、基於雲的方法在資訊傳輸方面比在本地系統有更多的時間延遲。佩克說,雖然 Intellectual Ventures 通常可以實現每秒 20 千兆位的資料傳輸速率,以將其計算機的資料傳輸到超級計算機,但如果他們使用位於場外的超級計算機,研究人員可能甚至無法獲得十分之一的速度。

© .