今年秋天,當大型強子對撞機(LHC)開始在其位於瑞士日內瓦附近、周長17英里(27公里)的地下粒子軌道內將質子撞擊在一起時,它不僅會開啟物理學的新時代,也會開啟計算的新時代。
預計在今年年底之前,大型強子對撞機將開始噴湧出相當於每五秒鐘一張DVD(五千兆位元組)的原始資料海嘯。它每年15拍位元組(1500萬千兆位元組)的輸出量將很快超過歷史上任何其他科學實驗的輸出量。
挑戰在於如何讓世界任何地方的科學家都可以在她的筆記型電腦上執行幾個命令即可訪問這些資料。解決方案是一個名為大型強子對撞機計算網格的全球計算機網路,如果一切順利,它可能會讓我們一窺未來網際網路的模樣。
關於支援科學新聞
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道: 訂閱。透過購買訂閱,您將有助於確保未來關於塑造我們當今世界的發現和想法的有影響力的故事。
一旦大型強子對撞機在明年某個時候達到滿負荷運轉,它將每秒鐘產生數百張粒子碰撞的快照,這些快照由四個位於地下、高一米半到八層的探測器捕獲。* 網格的任務是找到極其罕見的事件——這裡缺少一點能量,那裡有一組粒子的模式——這些事件可以解決諸如質量的起源或暗物質的本質等懸而未決的謎團。
早一代,歐洲核子研究組織(CERN)的研究員蒂姆·伯納斯-李著手建立一個全球性的“資訊池”,以應對類似的挑戰。當時和現在一樣,來自全球各地的數百名合作者都在努力掌握歐洲核子研究組織實驗中快速發展的資料。伯納斯-李的解決方案成為了全球資訊網。
但是,大型強子對撞機的資料洪流需要特殊處理。“如果我看看大型強子對撞機及其為未來所做的事情,”佐治亞理工學院高效能計算執行主任大衛·貝德說,“全球資訊網未能做到的一件事是管理大量的海量資料。”僅頻寬就是一個主要的瓶頸。貝德說,對於執行超級計算機模擬的研究人員來說,將資料寫入太位元組硬碟並透過聯邦快遞將其從一個超級計算機中心運送到另一箇中心,比透過網路傳輸龐大的資料集更便宜。
大型強子對撞機計算網格分階段處理資料,稱為層。“第0層”位於歐洲核子研究組織,是一個由10萬個當今最快CPU組成的超平行計算機網路,用於儲存和管理來自實驗的原始資料(1和0)。它透過專用的每秒10千兆位元的光纖線路將部分資料傳送到北美、亞洲和歐洲的11個“第1層”站點。例如,紐約州阿普頓的布魯克海文國家實驗室接收來自ALICE實驗的資料,該實驗使鉛離子發生碰撞。
從這些站點,資料被分發到全球大學、政府實驗室甚至私營公司的140個第2層計算機網路中,以便更輕鬆地訪問。第2層是科學家實際訪問資料並執行將原始1和0轉換為粒子能量和軌跡所需的各種實際數值分析的地方。
日內瓦歐洲核子研究組織資訊科技(IT)部門的專案負責人伊恩·伯德說,使資料可訪問的關鍵要素是一種稱為“中介軟體”的軟體。使用者想要的資訊可能分散在不同伺服器上的拍位元組資料中,並以不同的格式儲存。一個名為Globus的開源中介軟體平臺旨在無縫地收集該資訊,就好像它位於使用者自己的臺式電腦的資料夾中一樣。
大型強子對撞機程式設計師將對Globus進行的嚴峻考驗——以及由此產生的修改——可能是大型強子對撞機網格的第一個實際成果。如果專案科學家能夠在粒子物理學中馴服大規模的全球網路資料和計算週期,他們的解決方案很可能會應用於整個網際網路——就像伯納斯-李的專門HTML發明演變成現代科技社會的支柱一樣。
貝德設想未來的中介軟體允許家用計算機透過訪問附近環境感測器的資訊來提供即時天氣預報。或者它可能有助於篩選一生積累的個人醫療記錄或多年的家庭錄影,尋找隱約記得的事件。
具有諷刺意味的是,歐洲核子研究組織對網際網路的下一個重大貢獻可能對終端使用者來說幾乎是透明的。在一個完美的世界中,Globus 或其繼任者將簡單地使給定網格上的所有內容都可以從任何計算機直接且透明地訪問。“如果 Globus 獲得成功,”貝德說,“那麼你就不會聽到關於它的訊息。”
*更正(2008年9月3日):本文最初指出,大型強子對撞機將產生數百萬張粒子碰撞的快照;“數百萬”指的是碰撞次數,只有一部分會被記錄下來。