2016年,一款名為“阿爾法圍棋”的計算機因在古老而流行的策略遊戲圍棋中擊敗當時的圍棋世界冠軍李世乭而成為頭條新聞。這款由谷歌DeepMind開發的“超人”人工智慧,在與李世乭的五輪比賽中僅輸了一場,這讓人聯想到1997年加里·卡斯帕羅夫在國際象棋比賽中輸給IBM的“深藍”。圍棋涉及玩家透過移動黑白棋子(稱為棋子)來對抗,目標是在棋盤上佔據領地,一直被認為是機器對手更難攻克的挑戰,比國際象棋更復雜。
在阿爾法圍棋獲勝後,人們對人工智慧對人類智慧和生計的威脅進行了許多痛苦的反思,這與現在ChatGPT及其同類產品的情況非常相似。不過,在2016年輸棋後的新聞釋出會上,情緒低落的李世乭發表了一段帶有積極意義的評論。“它的風格不同,這種不尋常的經歷讓我花了一些時間來適應,”他說。“阿爾法圍棋讓我意識到我必須更深入地研究圍棋。”
當時,歐洲圍棋冠軍樊麾也曾在幾個月前輸給阿爾法圍棋一場私下的五局比賽,他告訴《連線》雜誌,這些比賽讓他“完全不同地”看待圍棋。這極大地提高了他的棋藝,以至於他的世界排名“飆升”,據《連線》雜誌報道。
支援科學新聞報道
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道: 訂閱。透過購買訂閱,您將幫助確保未來能夠繼續報道關於塑造我們當今世界的發現和想法的重要故事。
正式跟蹤人類決策的混亂過程可能很困難。但是,職業圍棋棋手幾十年來的棋譜記錄為研究人員提供了一種評估人類對人工智慧挑釁的戰略反應的方法。一項新的研究現在證實,樊麾在面對阿爾法圍棋挑戰後取得的進步並非只是一個偶然的僥倖。2017年,在2016年那次令人感到羞辱的人工智慧勝利之後,人類圍棋棋手獲得了詳細描述人工智慧系統走法的資料,並以非常人性化的方式開發了新的策略,從而提高了他們的棋藝決策質量。關於人類棋藝變化的證實出現在3月13日發表在《美國國家科學院院刊》上的研究結果中。
DeepMind首席研究科學家兼阿爾法圍棋專案負責人大衛·西爾弗說:“令人驚歎的是,人類棋手如此迅速地適應並將這些新發現融入到他們自己的棋藝中。”他沒有參與這項新的研究。“這些結果表明,人類將適應並在此基礎上發展,從而極大地提高他們的潛力。”
為了查明超人人工智慧的出現是否促使人類產生了新的棋藝策略,香港城市大學市場營銷系助理教授申敏圭和他的同事使用了一個包含1950年至2021年間580萬步棋譜的資料庫。這個記錄儲存在網站Games of Go on Download上,反映了早在19世紀的圍棋比賽中的每一步棋。研究人員從1950年開始分析比賽,因為那是現代圍棋規則確立的年份。
為了開始梳理這580萬步棋譜的龐大記錄,研究團隊首先建立了一種方法來評估每一步棋的決策質量。為了開發這個指標,研究人員使用了另一個人人工智慧系統KataGo,將人類的每個決策的勝率與人工智慧的決策的勝率進行比較。這項龐大的分析涉及模擬在580萬個人類決策中的每一個決策之後,比賽可能出現的10,000種結果。
有了每個人類決策的質量評級,研究人員隨後開發了一種方法來精確地確定遊戲中人類決策何時是新穎的,這意味著它在圍棋歷史上從未被記錄過。國際象棋棋手長期以來一直使用類似的方法來確定遊戲中何時出現新的策略。
在圍棋棋藝的新穎性分析中,研究人員繪製了每局比賽最多60步棋,並標記了何時引入新穎的走法。如果新穎的走法在某局比賽的第9步出現,而在另一局比賽中直到第15步才出現,那麼前者的比賽的新穎性指數得分將高於後者。申敏圭和他的同事發現,在2017年之後,研究團隊定義為新穎的大多數走法都在第35步之前出現。
然後,研究人員研究了遊戲中新穎走法出現的時間是否與決策質量的提高有關——即採取此類走法是否真的提高了玩家在棋盤上的優勢和獲勝的可能性。他們尤其想看看,在阿爾法圍棋在2016年擊敗人類挑戰者李世乭以及在2017年擊敗另一系列人類挑戰者之後,決策質量發生了什麼變化(如果有的話)。
研究團隊發現,在人工智慧擊敗人類圍棋冠軍之前,人類的決策質量水平在66年裡保持相當穩定。在2016-2017年的關鍵時期之後,決策質量評分開始攀升。人類正在做出更好的棋藝選擇——可能還不足以始終如一地擊敗超人人工智慧,但仍然更好了。
從2016-2017年之後,新穎性評分也大幅上升,因為人類在比賽序列的早期階段引入了新的走法。在他們對新穎走法和更高質量決策之間聯絡的評估中,申敏圭和他的同事發現,在阿爾法圍棋戰勝人類棋手之前,人類的新穎走法對高質量決策的貢獻平均低於非新穎走法。在這些具有里程碑意義的人工智慧勝利之後,人類引入遊戲的新穎走法對更好的決策質量評分的平均貢獻高於已知的走法。
對這些改進的一種可能的解釋是,人類記住了新的走法序列。在研究中,申敏圭和他的同事還評估了記憶能在多大程度上解釋決策質量。研究人員發現,記憶不能完全解釋決策質量的提高,並且“不太可能”是2016-2017年後出現的新穎性增加的根本原因。
德克薩斯大學達拉斯分校計算機科學教授穆拉特·坎塔西奧格魯說,這些發現,加上他和其他人所做的工作,表明“顯然,人工智慧可以幫助提高人類的決策能力。” 坎塔西奧格魯沒有參與目前的研究,他說,人工智慧處理“龐大的搜尋空間”(例如圍棋等複雜遊戲中所有可能的走法)的能力意味著人工智慧可以“找到解決問題的新方案和方法”。例如,人工智慧標記醫學影像提示可能患有癌症,可能會引導臨床醫生比以前更仔細地觀察。“反過來,這將使這個人成為一名更好的醫生,並防止將來犯此類錯誤,”他說。
坎塔西奧格魯補充說,一個障礙是——正如世界現在在ChatGPT中看到的那樣——使人工智慧更值得信賴的問題。“我相信這是主要的挑戰,”他說。
在這場對ChatGPT和其他人工智慧的新擔憂階段,這些發現為人工智慧成為盟友而不是“我們走向進步和更美好的旅程中的潛在敵人”提供了“充滿希望的視角”,申敏圭和他的合著者在給《大眾科學》的電子郵件中寫道。
申敏圭說:“我的合著者和我目前正在進行線上實驗室實驗,以探索人類如何改進他們的提示,並從這些程式中獲得更好的結果。”“我們不應將人工智慧視為對人類智慧的威脅,而應將其視為一種有價值的工具,可以增強我們的能力。”
