每一次線上互動都依賴於儲存在遠端伺服器中的資訊支架——而這些機器,堆疊在全球各地的資料中心,需要大量能源。國際能源署的資料顯示,目前全球資料中心約佔全球電力使用的1%到1.5%。而世界範圍內仍在爆發式增長的人工智慧熱潮可能會迅速推高這個數字。
過去幾個月,研究人員一直在普遍發出關於人工智慧巨大能源需求的警報。但本週發表在Joule雜誌上的一項同行評議分析,是首批次化正在迅速實現的需求的分析之一。人工智慧能力和應用的當前趨勢若持續下去,將導致英偉達到2027年每年出貨150萬臺人工智慧伺服器單元。根據新的評估,這150萬臺全速運轉的伺服器每年至少消耗85.4太瓦時的電力——超過許多小國一年的用電量。
這項分析由荷蘭中央銀行的資料科學家、阿姆斯特丹自由大學博士候選人亞歷克斯·德弗里斯進行,他在那裡研究新興技術的能源成本。此前,德弗里斯因對加密貨幣挖礦和交易的鉅額能源成本發出警報而聲名鵲起。現在,他已將注意力轉向最新的技術潮流。《大眾科學》與他談論了人工智慧對電力的驚人需求。
關於支援科學新聞報道
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保未來能夠繼續講述關於塑造我們當今世界的發現和思想的具有影響力的故事。
[以下是經過編輯和壓縮的採訪稿。]
您為什麼認為檢查人工智慧的能源消耗很重要?
因為人工智慧是能源密集型的。我在我的研究文章中舉了一個例子:我強調,如果要將谷歌的搜尋引擎完全變成類似ChatGPT的東西,並且每個人都以這種方式使用它——那麼你每天將有90億次聊天機器人互動,而不是90億次常規搜尋——那麼谷歌的能源使用量將會飆升。谷歌將需要像愛爾蘭一樣多的電力才能執行其搜尋引擎。
現在,這種情況不會發生,因為谷歌還需要投資1000億美元用於硬體才能實現這一目標。即使[該公司]有資金投資,供應鏈也無法立即交付所有這些伺服器。但我仍然認為,如果要在[搜尋引擎等]應用程式中使用生成式人工智慧,那麼它有可能使每次線上互動都變得更加資源密集,這一點值得說明。
我認為,當我們談論人工智慧的風險時,至少應該將可持續性納入其中。當我們談論錯誤的潛在風險、黑盒子的未知數或人工智慧歧視偏見時,我們也應該將可持續性作為一個風險因素包括在內。我希望我的文章至少能鼓勵朝這個方向思考。如果我們要使用人工智慧,它會有幫助嗎?我們能以負責任的方式做到這一點嗎?我們真的需要在第一時間使用這項技術嗎?終端使用者想要什麼和需要什麼,我們如何才能最好地幫助他們?如果人工智慧是解決方案的一部分,那好吧,繼續前進。但如果不是,那就不要使用它。
人工智慧的哪些過程正在消耗所有這些能源?
一般來說,人工智慧有兩個主要階段。一個是訓練階段,在這個階段你設定並讓模型自學如何行為。然後是推理階段,在這個階段你只需將模型投入即時執行,並開始向其輸入提示,以便它可以產生原創響應。這兩個階段都非常耗能,我們真的不知道那裡的能量比率是多少。從歷史上看,對於谷歌來說,平衡是60%推理,40%訓練。但後來隨著ChatGPT的出現,這種情況被打破了——因為與應用模型相比,訓練ChatGPT消耗的能量相對較少。
這取決於許多因素,例如這些模型中包含多少資料。我的意思是,ChatGPT驅動的這些大型語言模型以使用龐大的資料集和擁有數十億個引數而聞名。當然,使這些模型更大是導致它們需要更多能量的因素之一——但這也是公司使其模型更強大的方式。
在考慮人工智慧能源使用時,還有哪些其他變數需要考慮?
我的文章中沒有包括冷卻,但如果有任何資料可供參考,就會包括在內。一個很大的未知數是這些伺服器最終會落在哪裡。這非常重要,因為如果它們在谷歌,那麼額外的冷卻能源使用量將在10%的範圍內增加。但全球資料中心平均會增加50%的能源成本,僅僅是為了保持機器冷卻。有些資料中心的效能甚至比這還差。
您使用的硬體型別也很重要。最新的伺服器比舊的伺服器更高效。您要將人工智慧技術用於什麼也很重要。請求越複雜,伺服器為滿足請求而工作的時間越長,消耗的電力就越多。
在您的評估中,您概述了幾種不同的能源使用情景,從最壞情況到最佳情況。哪種最有可能發生?
在最壞的情況下,如果我們決定要在人工智慧上做所有事情,那麼每個資料中心的能源消耗量實際上都會增加10倍。這將導致全球電力消耗量大幅爆炸式增長,因為資料中心(不包括加密貨幣挖礦)已經佔全球電力消耗量的約1%。當然,這種情況不會發生——這根本不現實。這是一個有用的例子,說明人工智慧非常耗能。
在另一方面,你有這種零增長的想法——零。有人說,需求的增長將被效率的提高完全抵消,但這是一種非常樂觀的看法,沒有包括我們對需求和效率的理解。每次一項主要的新技術使一個過程更高效時,實際上都會導致更多人需求正在生產的任何東西。效率提高了需求,因此最終提高效率實際上並沒有節省能源。
我認為未來最有可能的道路是什麼?我認為答案是人工智慧相關的電力消耗將會增長。至少在最初,增長會有些緩慢。但隨著伺服器產量的增加,有可能在幾年內加速增長。瞭解這一點讓我們有一些時間來思考我們正在做什麼。
還需要哪些額外的研究或其他步驟?
我們需要更高質量的資料。我們需要知道這些伺服器的去向。我們需要知道能源本身的來源。當涉及到環境影響時,碳排放量才是我們真正關心的數字。能源需求是一回事,但它是來自可再生能源嗎?還是來自化石燃料?
也許監管機構應該開始要求人工智慧開發商披露能源使用情況,因為可供參考的資訊實在太少了。做這項分析真的很難——目前任何試圖從事人工智慧工作的人都面臨著同樣的挑戰,即資訊有限。我認為,如果透明度更高,那將會有所幫助。如果這種透明度沒有自然而然地到來(到目前為止還沒有),那麼我們應該考慮推動一下。
