科技巨頭開放虛擬世界供人工智慧程式使用

人工智慧演算法可以透過玩沉浸式 3D 電子遊戲學到很多東西

克里斯·拉特克利夫 (Chris Ratcliffe), *彭博社*, *蓋蒂圖片社*

在何塞·埃爾南德斯-奧拉洛（José Hernández-Orallo）開始將其用於自己的研究之前，他就已經熟悉《我的世界》(Minecraft) 電子遊戲了。這位在西班牙瓦倫西亞理工大學研究機器智慧基準的計算機科學家，首先是看著自己的孩子在 3D 虛擬世界中玩耍，這個虛擬世界專注於解決問題而不是射擊怪物。

2014年，微軟收購了《我的世界》，其科學部門微軟研究院允許自己的研究人員訪問該遊戲的新版本，該版本允許計算機程式以及人們探索和自定義 3D 環境。然後，在邀請包括埃爾南德斯-奧拉洛在內的一小群外部研究人員下載該世界的機器友好版本後，去年七月，微軟向所有人免費提供該版本，目的是加快人工智慧（AI）的進展。

現在，其他公司也紛紛效仿。12月3日，谷歌位於倫敦的部門 DeepMind 公開了自己的 3D 虛擬世界 DeepMind Lab，供外部開發人員下載和自定義。該公司最初建立這個世界是為了訓練自己的人工智慧程式。兩天後，由企業家埃隆·馬斯克 (Elon Musk) 共同創立的位於加利福尼亞州舊金山的研究公司 OpenAI 釋出了一個“元平臺”，使人工智慧程式可以輕鬆地與最初為人類設計的數十款 3D 遊戲以及一些網路瀏覽器和智慧手機應用程式進行互動。

關於支援科學新聞

如果您喜歡這篇文章，請考慮訂閱我們的獲獎新聞，以支援我們的工作訂閱。透過購買訂閱，您正在幫助確保關於當今塑造我們世界的發現和想法的具有影響力的故事的未來。

所有三個版本的釋出都為研究人員和軟體開發人員提供了簡單的方法來測試以前未見過的情況下的程式，並且讓程式透過自學來導航類似現實世界場景的新穎情況來獲得新技能。“像這樣的環境在人工智慧的未來中將發揮非常重要的作用，”西雅圖華盛頓大學的機器學習研究員佩德羅·多明戈斯 (Pedro Domingos) 說。

雅達利演算法

幾十年來，遊戲一直是人工智慧的試驗檯，但通常情況下，演算法都是按照預定義的策略進行遊戲。近年來，重點已經轉移到可以從自身經驗中學習的機器上。2015年初，DeepMind 公佈了一種演算法，該演算法透過反覆試驗，無需告知遊戲目標，就教會自己如何玩經典雅達利街機遊戲，而且比任何人類都玩得更好。

不過，這些遊戲是簡單的 2D 世界。像《我的世界》這樣將玩家視覺上嵌入環境中的“第一人稱”3D 電子遊戲更接近現實世界，因此是更復雜的試驗檯。

《我的世界》使使用者能夠與虛擬磚塊互動，並使用它們來構建結構，此外還可以導航和與預定義的結構互動。現在可供開發人員使用的版本稱為 Malmo，它允許演算法執行相同的操作。例如，埃爾南德斯-奧拉洛正在使用它來探索該環境是否可以用來建立機器智慧的基準。演算法可以競爭將磚塊排列成看起來最像某個物體的樣子，或者導航迷宮——測試比圖靈測試更廣泛的技能，圖靈測試是機器智慧最著名的測試，它側重於人工智慧像人類一樣聊天的能力。

《我的世界》之所以能轉換為人工智慧試驗檯的一個原因是，它已經允許玩家使用簡訊進行交流。英國劍橋微軟研究院的計算機科學家卡特婭·霍夫曼 (Katja Hofmann) 說，這可以幫助人工智慧學習在現實世界中與人類協作，她領導了建立 Malmo 的團隊。

機器人排練

霍夫曼說，虛擬世界對於開發最終將作為物理機器人執行的人工智慧也特別有用，因為這些環境的定製成本更低，並且比現實世界中的練習更快更安全。它們還允許機器人研究人員專注於方程式的智慧部分——物理機器人的機械挑戰可能會分散注意力。

除了埃爾南德斯-奧拉洛，微軟研究院還與少數正在使用 Malmo 專案的研究實驗室合作。但霍夫曼懷疑有更多的人在使用它，可能大約有 100 個。

DeepMind Lab 類似地允許研究人員建立迷宮等結構，他們的演算法可以學習收集獎勵以及導航。DeepMind 還在嘗試將“更自然主義的元素”（例如起伏的地形和植物）整合到平臺中，一位女發言人說。現在環境已經開放，該公司希望其他研究人員將幫助使環境對演算法更具挑戰性。“透過開源，我們允許更廣泛的研究社群參與塑造它，”她說。

OpenAI 的元平臺 Universe 將事情推向了更深遠的層次。透過為同一個人機智慧提供多個截然不同的環境進行取樣，它可以幫助解決該領域最困難的問題之一：建立可以在面對新情況時使用先前經驗的演算法。例如，模仿視覺皮層中腦細胞層的深度神經網路可以很快學會導航 3D 迷宮，但無法將知識轉移到導航另一個迷宮。“如果你改變迷宮的顏色，系統就會完全迷失，”埃爾南德斯-奧拉洛說。“最先進的技術會慘敗。”

微軟現在正在努力透過 Universe 提供 Malmo。“擁有一個社群平臺將加速每個人的發展，”OpenAI 的聯合創始人兼首席技術官格雷格·布羅克曼 (Greg Brockman) 說。

本文經許可轉載，並於2016 年 12 月 14 日首次釋出。