計算機科學家訓練人工智慧透過類比思考

梅蘭妮·米歇爾說,數字思維永遠不會真正像我們一樣,除非它們能夠進行類比

Portrait of Melanie Mitchell.

計算機科學家梅蘭妮·米歇爾。

圖片來源:Gabriella Marks for Quanta Magazine

普利策獎獲獎書籍《哥德爾、埃舍爾、巴赫》在 1979 年啟發了無數計算機科學家,但很少有人像 梅蘭妮·米歇爾 那樣受到啟發。在閱讀了這本 777 頁的鉅著後,當時在紐約擔任高中數學教師的米歇爾決定她“需要進入”人工智慧領域。她很快找到了這本書的作者,人工智慧研究員道格拉斯·霍夫施塔特,並說服他給她一個實習機會。當時她只上過幾門計算機科學課程,但他似乎對她的膽識印象深刻,並且並不在意她的學歷。

米歇爾準備了一份“最後一刻”的研究生院申請,並加入了霍夫施塔特在密歇根大學安娜堡分校的新實驗室。接下來的六年裡,兩人密切合作開發了 Copycat,這是一個計算機程式,用其共同創造者的話來說,該程式旨在“以心理學上現實的方式發現有洞察力的類比”。

Copycat 想出的 類比是字母的簡單模式之間的類比,類似於標準化測試中的類比。一個例子是:“如果字串 ‘abc’ 變為字串 ‘abd’,那麼字串 ‘pqrs’ 會變為什麼?” 霍夫施塔特和米歇爾認為,理解類比的認知過程——人類如何在相似的想法、感知和經驗之間建立抽象聯絡——對於解鎖類人人工智慧至關重要。


支援科學新聞報道

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保有關塑造我們當今世界的發現和想法的具有影響力的故事的未來。


米歇爾認為,類比可以比考試式的模式匹配深入得多。“這是透過將一種情況對映到另一種已經理解的情況來理解情況的本質,”她說。“如果你告訴我一個故事,我說,‘哦,同樣的事情發生在我身上,’字面上看,發生在你身上的事情並沒有發生在我身上,但我可以進行對映,使其看起來非常相似。這是我們人類一直在做的事情,甚至沒有意識到我們正在這樣做。我們不斷地沉浸在類比的海洋中。”

作為聖塔菲研究所的戴維斯複雜性教授,米歇爾的研究已經擴充套件到機器學習之外。她目前正在領導 SFI 的 自然和人工智慧系統智慧基礎 專案,該專案將在明年召開一系列跨學科研討會,探討生物進化、集體行為(如螞蟻等社會性昆蟲的集體行為)和物理身體如何共同促進智慧。但類比的作用在她工作中比以往任何時候都更加突出,尤其是在人工智慧領域——過去十年中,人工智慧領域的主要進展很大程度上是由深度神經網路推動的,深度神經網路是一種模仿哺乳動物大腦中神經元分層組織的技術。

“當今最先進的神經網路在某些任務上非常出色,”她說,“但它們非常不擅長將在一種情況下學到的東西轉移到另一種情況中”——這正是類比的本質。

Quanta 與米歇爾談論了人工智慧如何進行類比,該領域迄今為止從中學到了什麼,以及下一步需要走向何方。採訪內容經過濃縮和編輯,以求清晰。

為什麼類比對於人工智慧如此重要?

這是一種基本的思維機制,將幫助人工智慧達到我們期望的水平。有些人說,能夠預測未來是人工智慧的關鍵,或者能夠擁有常識,或者能夠在當前情況下檢索有用的記憶。但在這些事情中,類比都非常核心。

例如,我們想要自動駕駛汽車,但問題之一是,如果它們面臨的情況與它們接受訓練的情況略有不同,它們就不知道該怎麼做。我們人類如何在以前沒有遇到過的情況下知道該怎麼做?嗯,我們使用與先前經驗的類比。這也是我們在現實世界中需要這些人工智慧系統也能夠做到的事情。

但您也 寫道 類比是“人工智慧中一個研究不足的領域”。如果它如此重要,為什麼會這樣呢?

人們沒有對其進行更多研究的一個原因是,他們沒有認識到它對認知的本質重要性。早期的人工智慧的工作方式是專注於邏輯和行為規則的程式設計。最近,人們專注於從大量示例中學習,然後假設您將能夠使用已經學到的東西的統計資料對以前沒有見過的事物進行歸納。他們希望泛化和抽象能力能夠從統計資料中產生,但效果不如人們預期的那麼好。

例如,您可以向深度神經網路展示數百萬張橋樑的圖片,它可能可以識別出新的河流或其他物體上的橋樑圖片。但它永遠無法將“橋樑”的概念抽象為,例如,我們彌合性別差距的概念。事實證明,這些網路並沒有學會如何抽象。有些東西缺失了。人們現在才開始努力解決這個問題。

梅蘭妮·米歇爾是聖塔菲研究所的戴維斯複雜性教授,她從事數字思維研究已有數十年。她說,除非人工智慧能夠做一些人類獨有的事情:進行類比,否則人工智慧永遠不會真正“智慧”。圖片來源:Emily Buder Quanta Magazine;Gabriella Marks for Quanta Magazine

它們永遠學不會抽象嗎?

有一些新的方法,例如元學習,機器可以“學習更好地學習”。或者自我監督學習,像 GPT-3 這樣的系統學習用缺失的詞語填補句子,這使其能夠非常、非常令人信服地生成語言。有些人會認為,像這樣的系統最終會透過足夠的資料學會執行這種抽象任務。但我不這麼認為。

您將這種侷限性描述為 “意義的障礙”——人工智慧系統可以在某些條件下模仿理解,但在這些條件之外變得脆弱且不可靠。您為什麼認為類比是我們擺脫這個問題的方法?

我的感覺是,解決脆弱性問題將需要意義。這最終導致了脆弱性問題:這些系統在任何類似人類的意義上都不理解它們正在處理的資料。

“理解”這個詞是這些誰都無法就其真正含義達成一致的“手提箱詞”之一——幾乎就像我們尚無法解釋的精神現象的佔位符。但我認為這種抽象和類比機制是人類所稱的理解的關鍵。它是理解發生的一種機制。我們能夠將我們已經以某種方式知道的東西對映到新的東西。

所以類比是一種讓生物體保持認知靈活性的方式,而不是像機器人一樣行動?

我認為在某種程度上是的。類比不僅僅是我們人類所做的事情。有些動物有點像機器人,但其他物種能夠將先前的經驗對映到新的經驗。也許這是一種將智慧譜系放置在不同型別的生命系統上的方式:在多大程度上您可以進行更抽象的類比?

人類擁有這種特殊智慧的理論之一是,這是因為我們是如此社會化。您要做的最重要的事情之一是模擬其他人的想法,瞭解他們的目標並預測他們將要做什麼。而這是您透過與自己的類比來完成的事情。您可以將自己置於他人的位置,並將自己的思想對映到他們的思想上。這種“心智理論”是人工智慧領域的人們一直在談論的事情。它本質上是一種進行類比的方式。

您的 Copycat 系統是早期嘗試用計算機做到這一點的系統。還有其他的嗎?

“結構對映” 在人工智慧方面的工作側重於情境的基於邏輯的表示以及在它們之間進行對映。肯·福布斯和其他人使用了 [歐內斯特·盧瑟福在 1911 年提出的] 太陽系與原子的著名類比 [由歐內斯特·盧瑟福在 1911 年提出]。他們會有一組句子 [以稱為謂詞邏輯的形式化符號表示] 描述這兩種情況,並且他們根據它們的結構而不是句子的內容來對映它們。這個概念非常強大,我認為它是正確的。當人類試圖理解相似之處時,我們更關注關係而不是特定物件。

為什麼這些方法沒有流行起來?

學習的整個問題在很大程度上被排除在這些系統之外。結構對映會採用這些充滿了人類意義的詞語——例如“地球繞太陽旋轉”和“電子繞原子核旋轉”——並將它們相互對映,但沒有關於“繞……旋轉”意味著什麼的內部模型。它只是一個符號。Copycat 在字母串方面效果很好,但我們缺少的是如何擴充套件它並將其推廣到我們實際關心的領域的答案?

深度學習以其良好的可擴充套件性而聞名。它在產生有意義的類比方面更有效嗎?

有一種觀點認為,深度神經網路在其輸入層和輸出層之間進行某種魔術。如果它們在識別不同種類的犬種方面比人類更出色——它們確實如此——那麼它們應該能夠解決這些非常簡單的類比問題。因此,人們會建立一個大型資料集來訓練和測試他們的神經網路,並發表一篇論文說:“我們的方法在這個測試中獲得了 80% 的正確率。” 而另一個人會說:“等等,你的資料集有一些奇怪的統計特性,可以讓機器學習如何在不具備泛化能力的情況下解決它們。這是一個新的資料集,你的機器在這個資料集上表現非常糟糕,但我們的機器表現出色。” 這種情況不斷發生。

問題是,如果您必須在成千上萬個示例上對其進行訓練,那麼您就已經輸掉了這場戰鬥。這不是抽象的全部意義所在。這完全是機器學習領域的人們所說的“少樣本學習”,這意味著您在非常少量的示例上進行學習。這才是抽象的真正用途。

那麼還缺少什麼?為什麼我們不能像拼樂高積木一樣將這些方法組合在一起?

我們沒有告訴您如何做到這一點的說明書!但我確實認為我們必須將它們像樂高積木一樣組合在一起。這就是這項研究的前沿:所有這些事物的關鍵見解是什麼,以及它們如何相互補充?

很多人對 抽象和推理語料庫 [ARC] 非常感興趣,這是一個圍繞 人類基本上與生俱來的“核心知識” 構建的非常具有挑戰性的少樣本學習任務。我們知道世界應該被解析為物件,並且我們對空間的幾何形狀有所瞭解,例如某個物體在另一個物體之上或之下 [其他物體]。在 ARC 中,有一個顏色網格以人類能夠用這種核心知識描述的方式變成另一個顏色網格——例如,“一種顏色的所有正方形都向右移動,另一種顏色的所有正方形都向左移動。” 它為您提供了一個這樣的示例,然後要求您對另一個顏色網格執行相同的操作。

我非常把它看作是一個類比挑戰。您試圖找到對從一張影像到新影像的變化的某種抽象描述,並且您無法學習任何奇怪的統計相關性,因為您只有兩個示例。如何讓機器學習和推理嬰兒擁有的這種核心知識——這是我迄今為止提到的所有系統都無法做到的事情。這就是為什麼它們都無法處理這個 ARC 資料集的原因。這有點像聖盃。

如果嬰兒天生就具有這種“核心知識”,那麼這是否意味著人工智慧要進行這種類比,也需要像我們一樣的身體?

這是價值百萬美元的問題。這是一個非常有爭議的問題,人工智慧界對此沒有共識。我的直覺是,是的,如果沒有某種具身性,我們將無法在人工智慧中獲得類似人類的類比。擁有身體可能是必不可少的,因為其中一些視覺問題需要您從三維角度思考它們。對我來說,這與生活在這個世界上並移動我的頭部,以及理解事物在空間上是如何相關的有關。我不知道機器是否必須經歷那個階段。我認為它可能會經歷。

Quanta Magazine 許可轉載,Quanta Magazine 是 西蒙斯基金會 的一個編輯獨立的出版物,其使命是透過報道數學、物理和生命科學領域的研究進展和趨勢來增進公眾對科學的理解。閱讀 原始文章

© .