面對資料洪流,天文學家轉向自動化

無論是好是壞,機器學習和大資料都將改變天文學的研究

在智利一座山頂的日落時分拍攝的在建大型綜合巡天望遠鏡 (LSST)。天文學家們正在努力解決如何管理 LSST 和其他新型天文臺即將產生的資料洪流。

2017 年 8 月 18 日,天文學新時代恰如其分地以一條推文拉開序幕:“新 LIGO。光學對應源。讓你大吃一驚!” 一位天文學家搶先一步,在 LIGO(雷射干涉引力波天文臺)官方宣佈之前釋出了推文。該天文臺探測到引力波爆發,即時空中的漣漪,一顆環繞地球執行的伽馬射線望遠鏡同時探測到來自同一空間區域的電磁輻射。這些觀測結果——追溯到 1.3 億光年外一對碰撞的中子星——標誌著多信使天文學的關鍵時刻,在這種天文學中,天體事件是使用各種截然不同的望遠鏡和探測器進行研究的。

多信使天文學的前景是巨大的:透過不僅在光中觀測,而且同時在引力波和難以捉摸的粒子(稱為中微子)中進行觀測,研究人員可以前所未有地觀察到爆炸恆星、星系核和其他奇異現象的內部運作。但挑戰也很大:隨著天文臺變得更大、更靈敏,並監測越來越大的空間體積,多信使天文學可能會淹沒在資料洪流中,使得望遠鏡更難即時響應正在展開的天體物理事件。因此,天文學家們正在轉向機器學習——這種技術催生了 AlphaGo,第一個擊敗職業圍棋選手的機器。

機器學習可以透過自動化發現的關鍵早期階段來推動多信使天文學的發展,從充滿噪聲的資料洪流中篩選出潛在訊號,以便天文學家可以將注意力集中在最誘人的目標上。但這項技術的前景不止於此。天體物理學家也在嘗試使用它來稱量星系團,並建立研究宇宙演化所需的高解析度模擬。儘管人們擔心機器學習演算法的工作原理,但它們在速度和效率方面提供的巨大改進是毋庸置疑的。


關於支援科學新聞報道

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保未來能夠繼續講述關於塑造我們當今世界的發現和想法的具有影響力的故事。


伊利諾伊大學厄巴納-香檳分校國家超級計算應用中心 (NCSA) 的天體物理學家和人工智慧研究員 Eliu Huerta 說:“這就像一場海嘯。” “人們意識到,對於未來[即將到來]的大資料,我們不能再依賴過去的做法了。”

引力波熱線

就 LIGO 及其歐洲同行 Virgo 而言,過去並沒有追溯到很久以前。直到 2016 年 2 月,這些天文臺才宣佈首次探測到引力波,它是由兩個黑洞合併產生的。現在,在 4 月開始的第三次觀測執行中,先進版本的 LIGO 和 Virgo 已經開始釋出關於探測到的新潛在引力波源的公共警報,所有這些都是為了更好地支援多信使觀測。

這種做法似乎是例行公事,但它掩蓋了每次探測所需的巨大努力。例如,LIGO 收集的訊號必須由超級計算機與數十萬個可能的引力波特徵模板進行匹配。有希望的訊號會觸發內部警報;那些經受住額外審查的訊號會觸發公共警報,以便全球天文界可以尋找電磁和中微子對應物。

模板匹配的計算量非常大,對於合併產生的引力波,天文學家僅使用碰撞宇宙物體的四個屬性(兩者的質量和自轉的大小)來即時進行探測。從那時起,LIGO 科學家花費數小時、數天甚至數週的時間進行更多的離線處理,以進一步完善對訊號源的理解,這項任務稱為引數估計。

為了尋求使迷宮般的流程更快、計算效率更高的方法,在 2018 年發表的論文中,Huerta 及其在 NCSA 的研究小組轉向了機器學習。具體而言,Huerta 和他當時的研究生 Daniel George 開創了使用所謂的卷積神經網路 (CNN) 的先河,卷積神經網路是一種深度學習演算法,用於即時檢測和解碼引力波訊號。深度學習演算法使用由層組成的網路。每一層都由模仿人腦神經元活動的節點組成。粗略地說,訓練或教導深度學習系統包括向其輸入已經分類的資料——例如,被大量噪聲遮蔽的星系影像——並使網路正確識別資料中的模式。訓練資料集可能涉及數萬甚至數百萬個先前分類的資料例項。網路透過調整其類神經元節點之間的連線來學習,從而最終理解未分類的資料。

在 CNN 取得初步成功後,Huerta 和 George 以及 Huerta 的研究生 Hongyu Shen 擴大了這項工作,設計了深度學習演算法,這些演算法在超級計算機上使用數百萬個模擬引力波特徵進行訓練,這些特徵與來自高階 LIGO 先前觀測執行的噪聲混合在一起——高階 LIGO 是 2015 年完成的 LIGO 升級版。這些神經網路學會了在高階 LIGO 噪聲中找到嵌入的訊號。

這種方法與 LIGO 的標準方法之間存在關鍵差異。最重要的是,深度學習演算法可以即時進行檢測和引數估計。此外,與 LIGO 目前管理的四個引數相比,它們可以輕鬆地處理更多引數。例如,Huerta 小組的高中生 Adam Rebei 在最近的一項研究中表明,深度學習可以識別由偏心軌道上的黑洞合併產生的複雜引力波訊號——這是 LIGO 的傳統演算法無法即時完成的。“對於 LIGO 檢測到的已在出版物中報告的每個黑洞合併訊號,我們都可以在兩毫秒內重建所有這些引數,”Huerta 說。相比之下,傳統演算法可能需要數天才能完成相同的任務。

由於其能夠搜尋更大的引數集,深度學習系統有可能發現 LIGO 可能會錯過的特徵。雖然訓練需要超級計算機,但一旦經過訓練,神經網路就變得精簡而靈活,計算佔用空間極小。“你可以把它放在手機上並即時處理 LIGO 資料,”Huerta 說。

天空中的人工眼睛

Huerta 現在正在與麻省理工學院 LIGO 合作組織的成員 Erik Katsavounidis 合作,在現實世界中測試深度學習演算法。“目標是在 LIGO 和 Virgo 探測器的第三次和第四次觀測執行中部署其中的一些演算法,”Huerta 說。“這將是一次很好的社會實驗,看看我們如何對神經網路發現其他演算法未觀察到的複雜訊號做出反應,例如。”

如果成功,這樣的深度學習系統將非常高效地為其他望遠鏡生成警報。這些望遠鏡中最雄心勃勃的望遠鏡仍在智利 Cerro Pachón 山頂建造,是大型綜合巡天望遠鏡 (LSST)。建成後,8.4 米的 LSST 將能夠一次觀測 10 平方度的天空(相當於 40 個滿月的大小),每晚產生 15 到 20 太位元組的原始資料——與斯隆數字巡天在十年內產生的資料量相同。在如此龐大的資料寶庫中,LSST 的天文學家將尋找超新星、碰撞恆星和其他瞬變或可變現象——在電磁頻譜中瞬間變亮,然後在數小時、數天或數週內逐漸消失的源。任何給定瞬變體的科學價值通常與後續觀測發生的速度和徹底程度成正比。

加州大學伯克利分校的天體物理學家和機器學習專家 Joshua Bloom 說:“我們必須能夠梳理每晚天空變化位置的 100 萬到 1000 萬個警報,並在實際上即時決定哪些值得使用寶貴的資源進行後續觀測。” “機器學習將在其中發揮巨大作用。” 這種方法已經為 LSST 的先驅者帶來了回報,包括茲威基瞬變設施 (ZTF),該設施使用一個視場為 47 平方度的相機,安裝在加利福尼亞州帕洛瑪天文臺的一臺 1.2 米望遠鏡上。在預印本論文中,加州理工學院的 Dmitry Duev 和他的同事最近報告說,一個名為 DeepStreaks 的系統已經在幫助天文學家跟蹤小行星和其他快速移動的近地天體。“我們可以將探測條紋小行星的效率提高几個數量級,”研究人員寫道。

類似的技術可以用於在 ZTF 資料中搜索其他瞬變源。“機器學習對於專案的成功非常重要,”Bloom 說。多信使天文學的另一個重要組成部分是中微子的探測,中微子與來自類星體等天體物理物體的電磁輻射一起發射。(類星體是類星體——由遙遠星系中心巨型黑洞提供動力的高亮度物體——其高能粒子和輻射噴流指向地球。)

2017 年 9 月 22 日,IceCube,一箇中微子探測器,包含 5,160 個感測器,嵌入在南極下方一立方公里的冰中,探測到來自類星體的中微子。感測器尋找由μ子產生的條紋光,μ子是在中微子撞擊冰時產生的。但是,少數由中微子產生的μ子可能會被數百萬個由宇宙射線撞擊地球大氣層產生的μ子所淹沒。IceCube 基本上必須篩選μ子軌跡的混亂,以識別來自中微子的μ子軌跡——這是一項為機器學習量身定製的任務。

在去年 9 月的一篇預印本論文中,紐約大學的 Nicholas Choma 和他的同事報告說,他們開發了一種特殊的深度學習演算法,稱為圖神經網路,其連線和架構利用了冰中感測器的空間幾何形狀,以及只有少數感測器看到來自任何給定μ子軌跡的光這一事實。研究人員使用模擬資料(其中混合了背景噪聲和訊號)表明,他們的網路探測到的事件數量是 IceCube 目前使用的非機器學習方法的六倍以上。

Huerta 對這些成就印象深刻。“如果我們正在開發或建造這些下一代儀器來高保真地研究宇宙,我們也最好設計更好的演算法來處理這些資料,”他說。

盒子裡的愛因斯坦

儘管這些進步很重要,但深度學習演算法也帶來了一個主要擔憂。它們本質上是“黑匣子”,其操作細節被其分層元件的互連性以及使其發揮作用所需的數千甚至數百萬個可調引數所掩蓋。簡而言之,即使是從外部觀察的專家也很難準確理解任何給定的深度學習演算法是如何做出決定的。“這幾乎與物理學家思考世界的方式背道而馳,物理學家認為存在——並且應該存在——非常簡單的數學函式來描述世界的運作方式,”Bloom 說。

為了掌握對機器學習演算法正在做什麼的解釋,哈佛大學的天體物理學家和機器學習研究員 Michelle Ntampaka 和她的同事開發了一個 CNN 來分析星系團的 X 射線影像。他們使用 7,896 張模擬的 329 個大型星系團的 X 射線影像對網路進行了訓練和測試,這些影像旨在類似於錢德拉 X 射線天文臺生成的影像。CNN 在推斷星系團的質量方面與傳統技術一樣出色。但是,神經網路是如何完成這項工作的呢?

為了找出答案,Ntampaka 和她的團隊使用了一種由 Google 的 DeepDream 專案開創的技術,該技術使人類能夠視覺化深度學習網路正在看到的內容。Ntampaka 的團隊發現,CNN 學會了忽略來自星系團核心的光子,並且在進行預測時更關注來自其外圍的光子。天文學家大約在十年前憑經驗得出了這個完全相同的解決方案。“令人興奮的是,它學會了切除核心,因為這證明我們現在可以使用這些神經網路來回溯到潛在的物理學,”Ntampaka 說。

對於 Ntampaka 來說,這些結果表明機器學習系統並非完全無法解釋。“社群記憶體在一種誤解,認為它們只能是黑匣子,”她說。“我認為可解釋性即將到來。它正在到來。我們現在開始能夠做到這一點。” 但她也承認,如果她的團隊不瞭解將星系團的 X 射線輻射與其質量聯絡起來的潛在物理學,他們可能就不會發現神經網路正在從其分析中切除核心。

可解釋性問題在紐約市扁平研究所的天體物理學家 Shirley Ho 和她的同事的工作中凸顯出來。研究人員構建了一種深度學習演算法,他們稱之為深度密度位移模型,或 D3M(發音為“dee cube em”),以高效地建立我們宇宙的高解析度模擬。當望遠鏡收集關於宇宙大尺度結構的資料時,這些資料會與我們最好的模擬進行比較,而這些模擬本身是基於廣義相對論和量子力學等理論。最佳匹配可以幫助宇宙學家理解控制宇宙演化的物理學。然而,高解析度模擬非常昂貴——它們可能需要數百萬或數千萬小時的計算時間才能執行。因此,宇宙學家通常會求助於速度更快的低解析度模擬,這些模擬會做出簡化的假設,但準確性較差。

Ho 和她的同事首先生成了 10,000 對模擬,每對模擬都包含一個低解析度或低解析度模擬,模擬包含約 32,000 個星系的空間體積的演化,以及同一體積的高解析度或高解析度模擬。然後,他們一次訓練 D3M 一對,為其提供低解析度模擬(只需幾毫秒即可生成)作為輸入,並使其輸出高解析度對應物。一旦 D3M 學會這樣做,它就可以在約 30 毫秒內為任何給定的低解析度模擬生成每個高解析度模擬。這些模擬與使用標準技術建立的模擬一樣準確,但標準技術需要多出幾個數量級的​​時間。

除了驚人的加速之外,神經網路似乎比預期的更深入地理解了資料。訓練資料集僅使用一組六個宇宙學引數(例如,宇宙中被認為存在的暗物質的數量)的值生成。但是,當 D3M 被賦予一個宇宙的低解析度模擬時,該宇宙的暗物質含量與物理學家認為我們宇宙中存在的暗物質含量顯著不同,它正確地生成了一個具有新暗物質含量的高解析度模擬,儘管從未明確教導它這樣做。

對於 D3M 為何能夠在暗物質含量不同的情況下從低解析度模擬中外推高解析度模擬,Ho 和她的團隊有些不知所措。改變暗物質的量會改變影響星系的力,但該演算法仍然有效。Ho 說,也許它弄清楚了僅在一個引數發生變化時的外推,如果多個引數同時發生變化,則可能會失敗。她的團隊目前正在測試這個假設。

Ho 補充說,另一個“真正的巨大可能性”是 D3M 偶然發現了對物理定律的更深入理解。“也許宇宙真的很簡單,並且像人類一樣,深度學習演算法已經弄清楚了物理規則,”她說。“這就像說 D3M 已經弄清楚了廣義相對論,而沒有成為愛因斯坦。這可能是一種解釋。我無法告訴你什麼是正確的。在這一點上,在我們有更多證據之前,這幾乎是哲學性的。”

與此同時,該團隊正在努力使 D3M 在外推到不同的宇宙學引數值時失敗。“如果 D3M 在某些外推方式中失敗,也許它可以為我們提供關於它最初為何有效的提示,”Ho 說。

不幸的是,在天文學、天體物理學和宇宙學中使用如此先進的技術正在醞釀一場分裂。“這正在我們的社群中造成一點‘富人和窮人’[局面],”Bloom 說。“有些人越來越精通移動資料和對資料進行推理的語言,而有些人則不然。”

隨著“富人”繼續開發越來越好的機器學習系統,未來出現了一個誘人的前景,即這些演算法將直接從望遠鏡產生的資料中學習,然後進行推理,而無需使用模擬或預先分類的資料進行訓練——有點像征服人類的 AlphaGo 的繼任者雖然 AlphaGo 必須使用人類生成的資料進行教學,但新版本 AlphaGo Zero無需任何來自人類遊戲的資料即可自學如何下圍棋。如果天體物理學走同樣的道路,黑匣子可能會變得更黑。

阿尼爾·阿南塔斯瓦米The Edge of Physics (Houghton Mifflin Harcourt, 2010)、The Man Who Wasn't There (Dutton, 2015)、Through Two Doors at Once: The Elegant Experiment That Captures the Enigma of Our Quantum Reality (Dutton, 2018) 和 Why Machines Learn: The Elegant Math Behind AI (Dutton, 2024) 的作者。

更多作者:阿尼爾·阿南塔斯瓦米
SA Space & Physics Vol 2 Issue 5本文最初以“面對資料洪流,天文學家轉向自動化”為標題發表在SA Space & Physics 第 2 卷第 5 期 ()
doi:10.1038/scientificamericanspace1019-25
© .