人工智慧正在學習持續學習

一種新的機器學習技術模仿大腦適應新環境的能力

托馬斯·福克斯

加入我們的科學愛好者社群!

如果您畢業後停止學習會怎樣?這聽起來令人窒息,但這正是大多數機器學習系統的訓練方式。它們掌握一項任務後便會被部署。但是,一些計算機科學家現在正在開發能夠像人腦一樣持續學習和適應的人工智慧。

機器學習演算法通常採用神經網路的形式,神經網路是由大量簡單的計算元件(或神經元)組成的,這些元件透過強度或“權重”各不相同的連線進行通訊。考慮一種旨在識別影像的演算法。如果在訓練期間錯誤標記圖片,則會調整權重。當錯誤減少到某個閾值以下時,權重會凍結在設定值。

這項新技術將每個權重分成兩個值,這兩個值結合起來影響一個神經元可以啟用另一個神經元的程度。第一個值像傳統系統中一樣被訓練和凍結。但是,第二個值會根據網路中周圍的活動不斷調整。關鍵的是,該演算法還會學習如何調整這些權重。因此,神經網路學習行為模式,以及在面對新情況時如何調整該行為的每個部分。研究人員於七月在瑞典斯德哥爾摩的一次會議上介紹了他們的技術。


關於支援科學新聞業

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞業 訂閱。透過購買訂閱,您正在幫助確保未來能夠繼續講述關於塑造我們當今世界的發現和想法的具有影響力的故事。


應用該技術,該團隊建立了一個網路,該網路在僅看到幾次完整影像後,便學會了重建半擦除的照片。相比之下,傳統的神經網路需要看到更多的影像才能重建原始影像。研究人員還建立了一個網路,該網路在看到一個示例後,便學會了識別手寫字母(與印刷字母不同,手寫字母是不均勻的)。

在另一項任務中,神經網路控制一個角色在簡單的迷宮中移動以尋找獎勵。經過一百萬次試驗,具有新型半可調權重的網路每次試驗找到每個獎勵的次數是僅具有固定權重的網路的三倍。半可調權重的靜態部分顯然學習了迷宮的結構,而動態部分則學習瞭如何適應新的獎勵位置。“這非常強大,”加州大學伯克利分校的計算機科學家 Nikhil Mishra 說,他沒有參與這項研究,“因為演算法可以像人類一樣更快地適應新任務和新情況。”

優步乘車共享公司的計算機科學家兼論文的主要作者托馬斯·米科尼表示,他的團隊現在計劃處理更復雜的任務,例如機器人控制和語音識別。在相關工作中,米科尼希望模擬“神經調節”,這是一種即時的全網路適應性調整,使人類能夠在發生新穎或重要的事情時吸收資訊。

© .