本文發表於《大眾科學》的前部落格網路,僅反映作者的觀點,不一定反映《大眾科學》的觀點
宇宙的問題在於它太大了。不僅僅是在物理尺度上相對於人類所佔據的領域而言很大,而且在原子、分子、小行星、行星、恆星和星系的絕對數量方面也很大。這意味著,如果你想在宇宙中尋找一些特殊的東西,你必須花費大量的時間和精力來篩選掉其他一切。
也許在探索宇宙中是否存在其他技術物種的努力中,這種挑戰最為明顯。數字令人震驚。據估計,我們的銀河系擁有多達 4000 億顆恆星。我們現在懷疑大多數恆星都會擁有行星系統。如果其中任何地方能夠維持複雜的、可交流的生命,那麼就存在著無數的渠道,它們可以透過這些渠道——無論是故意的還是無意的——向銀河系的其他地方暴露它們的存在。
無線電傳輸可能存在於數千甚至數百萬個離散頻率上。或者在可見光、紅外線、紫外線,甚至伽馬射線頻率的其他電磁輻射中。所有這些都能夠被脈衝調製、調製、極化,並隨時間和根據未知的策略或意外而變化。可能存在物理結構遮蔽了原本自然的星光,或者發出熱能。或者是有意的中微子發射、引力波、工程分子振動發射和同位素編碼資訊。清單非常龐大。
關於支援科學新聞
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保有關塑造我們當今世界的發現和想法的具有影響力的故事的未來。
目前,我們僅僅觸及了表面。即使量化我們的缺點也相當具有挑戰性。在 2018 年,Wright、Kanodia 和 Lubar 的一篇論文對無線電搜尋應用了多維測量,並得出結論,用通俗的話說,到目前為止,我們“看”到的相當於地球海洋中一個熱水浴缸的水量。
但是,改進這項工作正在進行中。最近,“突破聆聽”專案釋出了一個新的資料集,其中包含約 2PB 的射電望遠鏡資料(來自綠岸和帕克斯天文臺)。該資料包括圍繞銀河系平面的系列測量(包括 20 個已知的系外行星系統,它們可能見證地球凌日太陽)、銀河系中心和星際彗星 2I/鮑裡索夫。
然而,儘管這些原始資料令人印象深刻,但它也僅代表了開始真正限制我們附近技術可見生命機率所需的一小部分。這就引出了一個問題,即隨著 SETI 資料的規模越來越大,我們將如何處理它們。
關鍵問題之一是我們不希望不適當地偏向我們審查資料的方式。也許在某個地方存在一個非常乾淨的“訊號”,它是無可辯駁的人造和地外起源。但也可能沒有。我們如何尋找我們不知道的東西?許多研究人員已經認真思考過這個問題。一種特別有希望的攻擊路線可能是利用過去十年左右機器學習的非凡進步。特別是深度學習系統(虛擬神經網路的層和巢狀)擅長感知資料中複雜而微妙的相關性和模式。
像生成對抗網路和卷積神經網路這樣的方法已經被研究作為篩選 SETI 資料的方法——在沒有不適當的先入之見的情況下尋找不尋常的結構。一旦系統經過訓練,它就可以非常高效地處理資料。但問題是,訓練可能是一項巨大的計算負擔。特別是當“規則集”本身是由深度學習系統發現時;當我們儘可能地將人類排除在迴圈之外時。
SETI 挑戰的巨大性可能不僅僅在於資料集的規模(以及首先獲取這些資料集),還在於問題的開放性。一旦我們考慮到我們可能不知道訊號是如何編碼的(無論是在無線電還是光線中,或其他方式),遊戲很快就會變得非常非常昂貴。例如,谷歌的“Transformer”深度學習系統可以在數千個處理器上執行,以訓練數億個引數。但能源成本是驚人的,訓練執行記錄了相當於數十萬磅二氧化碳的碳足跡。
答案是什麼?可能在於量子計算。儘管圍繞量子計算存在令人痛苦的炒作(和誤解),但它確實為當前深度學習系統所依賴的某些任務(例如,非常大的矩陣操作)帶來了巨大的希望。我們最終有可能利用量子計算來幫助訓練我們的機器,然後將它們釋放到龐大的 SETI 資料集上。以我們甚至無法想象的方式尋找訊號。
當然,可能在我們需要所有這些之前,我們就會很幸運。但如果我們沒有,那麼我們發現其他智慧的最佳工具可能源於自然界最深刻、最令人費解的規則,這種想法具有一定的詩意。