編者注(2023年2月22日):本文最初於2022年2月11日釋出。我們重新發布此文是因為《Gran Turismo》玩家現在可以在最新版本的遊戲中與人工智慧 Gran Turismo Sophy 競速。
為了沿著最快的“賽車線”飛速過彎而不失控,賽車手必須以精確的時序進行剎車、轉向和加速。這個過程取決於摩擦力的極限,而摩擦力又受已知的物理定律支配——這意味著自動駕駛汽車可以學會以最快的速度完成一圈(正如一些汽車已經做到的那樣)。但是,當自動駕駛汽車必須與其他汽車共享空間時,問題就變得棘手得多。現在,科學家們透過訓練一個人工智慧程式,使其在超逼真的賽車遊戲《Gran Turismo Sport》中超越人類競爭對手,從而虛擬地解決了這一挑戰。這些發現可能為自動駕駛汽車研究人員指出新的方向,以使這項技術在現實世界中發揮作用。
人工智慧已經在某些影片遊戲中征服了人類玩家,例如《星際爭霸II》和《Dota 2》。但索尼人工智慧美國公司主管兼這項新研究的合著者彼得·伍爾曼表示,《Gran Turismo》與其他遊戲有顯著的不同,該研究發表在《自然》雜誌上。他解釋說:“在大多數遊戲中,環境定義了規則,並保護使用者免受彼此的侵害。”“但在賽車中,汽車彼此非常接近,並且有一種非常精細的禮儀感,必須由[人工智慧]代理學習和部署。為了獲勝,他們必須尊重對手,但他們也必須保持自己的駕駛路線,並確保他們不會輕易讓路。”
支援科學新聞報道
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道: 訂閱。透過購買訂閱,您正在幫助確保有關塑造我們當今世界的發現和思想的具有影響力的故事的未來。
為了教會他們的程式要領,索尼人工智慧研究人員使用了一種稱為深度強化學習的技術。他們獎勵人工智慧某些行為,例如保持在賽道上、保持對車輛的控制以及尊重賽車禮儀。然後,他們讓程式自由嘗試不同的賽車方式,使其能夠實現這些目標。索尼人工智慧團隊訓練了多個不同版本的人工智慧,稱為 Gran Turismo Sophy(GT Sophy),每個版本都專門用於在特定賽道上駕駛特定型別的汽車。然後,研究人員將該程式與人類《Gran Turismo》冠軍進行了對抗。在去年7月進行的第一項測試中,人類獲得了最高的團隊總分。在2021年10月的第二次比賽中,人工智慧取得了突破。它在個人和團隊賽中都擊敗了人類對手,並創造了最快圈速。
人類玩家似乎坦然接受了失敗,有些人很享受與人工智慧對抗的樂趣。“我們從車手那裡聽到的一些事情是,他們也從 Sophy 的操作中學到了新東西,”索尼人工智慧戰略與合作主管埃麗卡·加藤·馬庫斯說。“人工智慧使用的線路非常棘手,我可能可以做一次。但這太難了——我永遠不會在比賽中嘗試,”艾米麗·瓊斯說,她是2020年國際汽聯認證的 Gran Turismo 錦標賽世界總決賽選手,後來與 GT Sophy 比賽。儘管瓊斯說與人工智慧競爭讓她感到有點無力,但她形容這種體驗令人印象深刻。
《Gran Turismo Sport》中的汽車。圖片來源:索尼互動娛樂
瓊斯說:“賽車就像許多運動一樣,都是為了儘可能接近完美的圈速,但你永遠無法真正達到那裡。”“對於 Sophy 來說,看到一些完美的圈速真是太瘋狂了。沒有辦法再快了。”
索尼團隊目前正在進一步開發人工智慧。“我們為每種汽車-賽道組合訓練了一個代理,即 GT Sophy 的一個版本,”伍爾曼說。“我們正在研究的事情之一是:我們能否訓練一個單一策略,使其可以在遊戲中的任何賽道上的任何汽車上執行?”在商業方面,索尼人工智慧還與《Gran Turismo》的開發者索尼互動娛樂子公司 Polyphony Digital 合作,以期將 GT Sophy 的一個版本納入遊戲的未來更新中。為此,研究人員需要調整人工智慧的效能,使其可以成為一個具有挑戰性的對手,但又不是無敵的——即使對於技能不如迄今為止測試過人工智慧的冠軍的玩家也是如此。
由於《Gran Turismo》提供了特定汽車和特定賽道的逼真近似——以及支配每輛車的獨特物理引數——這項研究也可能在影片遊戲之外有應用。“我認為有趣的一點,也是它與 Dota 遊戲的不同之處,在於它處於一個基於物理的環境中,”人工智慧研究公司 OpenAI 的軟體工程師兼《OpenAI Five》專案的合著者布魯克·陳說,《OpenAI Five》專案在《Dota 2》中擊敗了人類。“它不在現實世界中,但仍然能夠模擬現實世界的特徵,從而使我們能夠訓練人工智慧更多地瞭解物理世界。”(陳沒有參與 GT Sophy 的研究。)
斯坦福大學機械工程學教授 J. 克里斯蒂安·格德斯說:“《Gran Turismo》是一個非常好的模擬器——它在某些方面被遊戲化了,但它確實忠實地代表了不同汽車和不同賽道會帶來的許多差異,”他沒有參與這項新研究。“在我看來,這是目前最接近於任何人發表論文說人工智慧可以在賽車環境中與人類一較高下的事物。”
然而,並非所有人都完全同意。“在現實世界中,你必須處理諸如腳踏車手、行人、動物、從卡車上掉下來並落在路上的東西,你必須能夠避開這些東西,惡劣的天氣,車輛故障——諸如此類的東西,”史蒂文·斯拉多弗說,他是加州大學伯克利分校交通研究所加州先進交通技術合作夥伴計劃(California PATH)的研究工程師,他也沒有參與《自然》雜誌的論文。“所有這些東西都不會在遊戲世界中出現。”
但格德斯表示,GT Sophy 的成功仍然可能有用,因為它顛覆了關於自動駕駛汽車必須如何程式設計的某些假設。自動駕駛汽車可以根據物理定律或其人工智慧訓練做出決策。“如果你看看文獻中已有的東西——以及在某種程度上,人們正在將其投入使用——運動規劃器將傾向於基於物理的最佳化,而感知和預測部分將是人工智慧,”格德斯說。然而,對於 GT Sophy 來說,人工智慧的運動規劃(例如,決定如何在效能的極限下接近彎道而不會導致碰撞)是基於公式的人工智慧方面。“我認為自動駕駛汽車開發人員應該吸取的教訓是:這裡有一個數據點表明,我們的一些先入為主的觀念——即這個問題的某些部分最好用物理學來完成——需要重新審視,”他說。“人工智慧也可能在那裡發揮作用。”
格德斯還認為,GT Sophy 的成就可能對人類和自動化系統互動的其他領域有所啟示。他指出,在《Gran Turismo》中,人工智慧必須平衡在賽道上實現最快路線的難題,以及與通常不可預測的人類平穩互動的難題。“如果我們確實有一個人工智慧系統可以在這種環境中做出一些複雜的決策,那麼這可能具有適用性——不僅僅是對於自動駕駛,”格德斯說,“也適用於諸如機器人輔助手術或在家中提供幫助的機器人的互動。如果你有一項任務需要人類和機器人一起移動某物,那麼在某些方面,這比機器人試圖自己完成它要棘手得多。”
本文的標題為“人工智慧冠軍”,已改編收錄在2022年5月刊的《大眾科學》雜誌中。
