關於支援科學新聞報道
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保有關塑造我們當今世界的發現和想法的具有影響力的故事的未來。
當任天堂的 Wii 遊戲機在 2006 年 11 月首次亮相時,其運動感應手持“Wiimotes”讓玩家們從沙發上站起來並開始活動。現在,微軟正試圖透過完全消除控制器來超越其競爭對手:它已經披露了其如何開發 Project Natal 的細節,該專案使 Xbox 360 玩家能夠透過自然的身體動作來操縱螢幕上的角色。
這種機器學習技術將使玩家能夠在他們的客廳裡透過模仿動作來完成諸如踢數字足球或拍打手球之類的動作。“你的身體而不是控制器成為了遊戲輸入,”微軟 Xbox 360 孵化總監 Alex Kipman 說。
微軟在 2009 年 6 月推出了其雄心勃勃的 Xbox 升級,並預計將在 2010 年年底假期前推出該技術。Natal 將包括一個深度感測器,該感測器使用紅外訊號來建立玩家身體移動時的數字 3D 模型,一個可以捕捉諸如面部表情等精細細節的攝像機,以及一個可以識別和定位個人聲音的麥克風。
要對一個遊戲系統進行程式設計,使其能夠識別出人體幾乎無限的關節位置組合是一個令人畏懼的計算難題。“身體的每一個動作都是一個輸入,因此您需要對動作程式設計近乎無限的反應,”Kipman 說。
微軟沒有試圖預先程式設計動作,而是決定像人類一樣透過從經驗中推斷,來教會其遊戲技術即時識別手勢。英國劍橋微軟研究院的研究員 Jamie Shotton 為此設計了一種機器學習演算法。它還可以識別姿勢並以每秒 30 幀的速度在螢幕上的遊戲空間中渲染它們,這種速率可以傳達流暢的運動。本質上,經過 Natal 增強的 Xbox 將在不需要傳統運動捕捉方法中所使用的鏡面緊身衣的情況下,即時進行運動捕捉。
為了訓練 Natal 完成這項任務,微軟需要收集大量的生物識別資料。該公司派觀察員到世界各地的家庭,在那裡他們拍攝了諸如轉動方向盤或接球等基本動作的影片,Kipman 說。微軟研究人員後來費力地選擇了這些鏡頭中的關鍵幀,並標記了每個人身體上的每個關節。Kipman 和他的團隊還進入好萊塢的運動捕捉工作室,收集更多雜技動作的資料。
“在訓練期間,我們需要為演算法提供兩件事:合成的看起來逼真的影像,以及對於每個畫素,身體的相應部位,”Shotton 說。該演算法處理資料並更改不同元素的值,以達到最佳效能。
為了保持資料量可管理,該團隊需要找出哪些元素對於訓練最相關。例如,該系統不需要識別整個身體質量,而只需要識別骨骼關節的間距。在將資料縮小到基本動作後,研究人員將每個獨特的姿勢對映到代表不同年齡、性別和體型的 12 個模型。
最終的結果是一個巨大的資料庫,其中包含標記了人們關節的影片幀。百分之二十的資料用於訓練系統的“大腦”來識別動作。工程師將其餘資料保留在“真實值”資料庫中,用於測試 Natal 的準確性。
選擇最佳演算法並篩選出基本資料是機器學習藝術的核心。為了測試 Natal 識別姿勢的能力,工程師會向其展示真實值中的影像,然後生成一個數字畫素圖,其中計算機對畫素正確放置在身體上的確定性越高,畫素就越亮。工程師測試關於如何改進效能的假設,試圖微調薄弱區域,而不會使強項退步。系統識別手勢越準確,玩遊戲就越有趣。
當然,微軟並不是唯一一家探索手勢介面的遊戲公司。據新科學家報道,競爭對手索尼在 5 月於德國斯圖加特舉行的 2009 年 Vision 貿易展覽會上展示了一款帶有立體攝像機和深度感測器的原型互動通訊單元 (ICU)。索尼在 Atracsys, LLC 的幫助下開發了 ICU,這是一家專門從事光學跟蹤技術的瑞士公司。儘管索尼生產流行的 PlayStation 遊戲機,但該公司表示,目前計劃僅在廣告行業而非遊戲市場中推廣其新技術。競爭對手任天堂尚未透露任何允許其 Wii 系統在不需要 Wiimote 的情況下執行的計劃。
儘管如此,麻省理工學院媒體實驗室 有形媒體小組的負責人 Hiroshi Ishii 表示,控制器不應完全消失。“我堅信手中握著有形的東西,”他說。此外,Wiimote 裝置提供觸覺反饋,例如振動或阻力,這使得動作更加真實。他指出,即使對於像 Natal 的類足球彈射遊戲演示這樣的活動,玩家也可能會錯過控制器所提供的與物理物體連線的模擬感覺。
但是,微軟遊戲工作室歐洲的創意總監 Peter Molyneux 期待著一種新的計算機娛樂方式,因為消除遊戲控制器可以帶來更多的創意可能性。“Natal 迫使我作為一名設計師將此視為玩家與一項技術之間的關係,”他說。“我們正在努力創造一種感覺彷彿它活著的東西。”