人工智慧天氣預報尚不能取代人類

GraphCast 和其他基於人工智慧的預報工具提供了一種全新的天氣預測方式，但它們也有侷限性

Satellite image of the sun rising over the east coast of the United States and Canada as Hurricane Lee approaches Nova Scotia on September 15, 2023 — 颶風李的陽光升起，從紐約市到緬因州都投下了相當大的陰影。

CSU/CIRA & NOAA

去年九月中旬，當颶風李在百慕大以西向北彎曲時，預報員們正忙於查閱天氣模型和颶風探測飛機的資料，以評估這場危險的風暴可能在何處登陸：新英格蘭或更東邊的加拿大。氣象學家越早這樣做，他們就能越早警告那些處於破壞性陣風、猛烈風暴潮和暴雨路徑中的人們。在登陸前六天，很明顯李將沿著向東的路徑前進，並據此釋出了警告。但另一種工具——一種名為 GraphCast 的實驗性人工智慧模型——在預報員的傳統模型之前整整三天就準確地預測了這一結果。

GraphCast 的預測展示了人工智慧在改進天氣預報方面的潛力——它可以更快地建立預報，而且計算能力更低。但它是否預示著該領域真正的變革，或者僅僅會成為人類預報員用來確定風向的眾多工具之一，目前仍懸而未決。

GraphCast 由 Google DeepMind 開發，是近年來發布的幾個人工智慧天氣模型中最新的一個。谷歌的 MetNet 於 2020 年首次推出，已經應用於該公司天氣應用程式中的“即時預報”等產品中，NVIDIA 和華為也都開發了自己的 AI 天氣模型。所有這些模型都被標榜為具有與最佳非 AI 預報計算機模型相當或更高的準確性，並在氣象學領域引起了轟動，其中 GraphCast 引起的轟動最為顯著。“它確實產生了很大的影響，”歐洲中期天氣預報中心 (ECMWF) 的機器學習科學家 Mariana Clare 說。ECMWF 是一個獨立的政府間組織，為 35 個國家釋出預報，並擁有許多專家認為最好的天氣預報模型之一。

支援科學新聞報道

如果您喜歡這篇文章，請考慮透過以下方式支援我們屢獲殊榮的新聞報道訂閱。透過購買訂閱，您正在幫助確保有關當今塑造我們世界的發現和思想的具有影響力的故事的未來。

在颶風李來臨之前，DeepMind 研究團隊透過向 GraphCast 輸送歷史天氣資料來測試其效能，以檢視它是否能準確“預測”發生的事情。2023 年 11 月發表在《科學》雜誌上的研究結果表明，在 90% 的測試案例中，人工智慧的效能與黃金標準 ECMWF 的整合預報系統 (IFS) 相當甚至更好。但看到 GraphCast 在颶風李的即時工作中發揮作用，尤其讓其創造者之一、谷歌 DeepMind 的研究科學家 Rémi Lam 感到震驚。Lam 說，李的預測和其他一些即時預報是“對該系統實際執行的真實確認”。

人工智慧的工作方式與傳統的預報模型截然不同。後者是旨在捕捉大氣混亂物理現象的複雜方程網路。它們被輸入來自世界各地的氣象氣球和氣象站的資料，並利用這些資料來預測天氣將如何隨著各種氣團和其他大氣特徵的相互作用而展開。預報員通常執行多個此類模型，然後將結果資訊——透過他們自己對當地地理環境以及每個模型的優勢和劣勢的專家知識進行過濾——整合到連貫的預測中。

相比之下，GraphCast 和大多數其他新的人工智慧工具放棄了理解和以數學方式複製真實世界物理現象的努力（儘管 NVIDIA 的 FourCastNet 是一個例外）。相反，人工智慧工具是統計模型：它們識別由數十年觀測天氣記錄和從物理預報中收集的資訊組成的訓練資料集中的模式。因此，這些模型可能會注意到某天的天氣設定與過去發生的類似事件相似，並根據該模式進行預報。

亞利桑那大學大氣科學和水文學副教授 Kim Wood 說，由於人工智慧模型依賴於過去的資料，因此大多數人工智慧模型可能不太擅長預測罕見和前所未有的事件。此類事件包括颶風哈維，它在 2017 年在德克薩斯州部分地區降下了前所未有的 60 英寸降雨，以及颶風奧蒂斯異常迅速增強，從熱帶風暴升級為 5 級怪物，就在去年襲擊墨西哥太平洋海岸之前。“它在[訓練資料中]最常看到的事件，它最擅長捕捉。因此，平均而言，它可能相當不錯，”Wood 說。“但是，可能永遠改變人們生活的事件——它可能會更難應對。”Wood 指出，隨著氣候變化，這些“罕見”事件變得越來越普遍，因此準確捕捉和預測它們變得越來越重要。

ECMWF 的 Clare 和 Google DeepMind 的 Lam 都表示，GraphCast 似乎也不太擅長預測風暴和降雨強度。這可能是因為該模型的解析度相對較低；它以 28 平方公里的區塊觀察世界，而陣風和暴雨發生在城市街區和社群的尺度上。“肯定有改進的空間，”Lam 說，但為了獲得更高解析度的 AI 模型，他和他的同事需要編譯更多更高解析度的訓練資料——要多得多。他補充說，這是一個挑戰，但可能並非無法克服。

儘管 AI 模型確實可以在幾分鐘內吐出一個預報，而物理模型完成一次由超級計算機驅動的執行需要兩到三個小時，但無法確定 AI 究竟是如何得出其預報的。與物理模型不同，GraphCast 和其他類似的預報工具是“不可解釋的”。這意味著結果無法輕易追溯到構成這些模型的數千萬個引數。“當模型出錯時，我希望能夠檢視細節並找出原因，”北達科他大學大氣科學副教授 Aaron Kennedy 說。例如，ECMWF 模型著名地預測颶風桑迪將作為一場強風暴轉向美國海岸，而美國國家海洋和大氣管理局 (NOAA) 使用的預報模型卻沒有預測到。預報員能夠深入研究這兩個模型，並確定 ECMWF 模型更好地表示了桑迪的旋轉。

能源公司 Cheniere Energy 的氣象學家兼休斯頓極端天氣網站 The Eyewall 的聯合創始人 Matt Lanza 同意理解錯誤是有價值的——在某種程度上。“在某種程度上，這是一個問題。人工智慧的[黑匣子]性質將成為該領域一些人接受它作為有用的事物之一的障礙，”他說。“我們不能盲目信任模型......，但我們正處於這個過程的早期，並且會有更多的研究來理解它，”Lanza 補充道。“我認為答案最終會出現。”他渴望看到人工智慧模型能做什麼。

Clare 說，GraphCast 節省的時間和計算能力可以使那些缺乏超級計算機訪問許可權（以及大型人類預報員團隊）的公司和機構更容易進行天氣建模。目前，只有少數政府預報機構生成大部分天氣預報，因為它們是唯一有能力這樣做的組織。

一個更具體的挑戰是，GraphCast 現在只能生成所謂的確定性預報：一個單一的預測，沒有給出實際發生的可能性機率。Clare 說，GraphCast 的每次執行，在給定一組引數的情況下，都會產生類似的輸出——因此它不能輕易地用於建立一系列預報可能性。這與傳統的物理集合預報不同，後者接受大氣固有的隨機性。美國國家氣象局 (NWS) 天氣預報中心（NOAA 的一部分）的預報業務主管 Greg Carbin 將現有天氣模型預報的軌跡比作漂浮在河流上的軟木塞。即使您每次都小心地將相同的軟木塞放在相同的起點，它們向下遊的路徑也會有所不同。軟木塞移動的時間越長，它們最終彼此之間的距離就越遠。“天氣預報是不確定的，因為天氣系統存在不確定性，”Clare 解釋說。目前 GraphCast 無法捕捉到這一點。Lam 說，他和他的同事正在努力將機率構建到該模型的未來版本中。

然而，即使 GraphCast 變得具有機率性——甚至即使該模型的解析度得到提高，並且人工智慧在降雨和風暴強度預報方面變得更加準確——建模仍然只是天氣預報流程中的一個組成部分，NWS 高階建模系統顧問 Hendrik Tolman 說。預報的第一步是透過感測器收集有關世界狀況的資料。第二步是將所有這些觀測結果整合到引數中，以輸入模型。然後是建模，最後是將預報轉化為公眾資訊的過程。Tolman 說，為氣象學的單個組成部分開發捷徑並不能消除對專家人員的需求，他們仍然需要收集、傳遞和解釋從一個步驟到下一步的資訊。

與大眾科學交談的每位專家都將 GraphCast 和其他 AI 模型描述為他們工具包中的附加工具。如果 AI 可以快速且廉價地生成準確的預報，那麼沒有理由不開始將其與現有方法一起使用。事實上，ECMWF 一直在其網站上釋出 GraphCast 預報以及其他 AI 和實驗性模型的預報，並且正在開發自己的 AI 預報模型。同樣，NOAA 研究人員一直在評估是否以及如何將 GraphCast 納入其集合預報中。

但是，在未來五到十年內，人工智慧模型是否會取代物理模型——以及人類——的世界？預測表明這種可能性很小。