機器人能透過自身經驗進行學習嗎?

研究人員對機器人進行程式設計,以觀察它們是否能學習一種非常人性化的特質:常識


支援科學新聞報道

如果您喜歡這篇文章,請考慮支援我們屢獲殊榮的新聞報道,方式是 訂閱。透過購買訂閱,您正在幫助確保關於塑造我們當今世界的發現和想法的重大故事擁有未來。


計算機從房屋大小、基於真空管且價格堪比房屋的機器,發展到廉價的晶片驅動桌面型號,且處理能力大幅提升,僅僅用了幾十年時間。“個人機器人”——可以在家或辦公室提供幫助的廉價機器——的時代可能比我們想象的更近。但首先,艾姆斯市愛荷華州立大學電氣與計算機工程助理教授亞歷山大·斯托伊切夫說,機器人必須被教會做一些我們本能地知道的事情:如何學習。

“真正有用的個人機器人[必須具備]從與物理和社會環境的互動中自主學習的能力,”斯托伊切夫說,他的發展機器人學領域將發展心理學和神經科學與人工智慧和機器人工程相結合。“一旦購買,它不應依賴於人類程式設計師。它必須是可訓練的。”

斯托伊切夫和一組研究生正在開發軟體,以教導機器人像兩歲兒童一樣學習。他們的平臺是一個人形機器人,它伸出兩個由馬薩諸塞州劍橋市的Barrett Technology, Inc.製造的 60 磅(27 公斤)重的全臂機械手 (WAM),每個機械手都配備一個 2.6 磅(1.2 公斤)重的三指BarrettHand

在一組實驗中,機器人被呈現了 36 種不同的物體,包括冰球和特百惠容器。它可以對每個物體執行五種不同的動作——抓取、推、敲擊、搖晃和掉落——並且必須僅根據它們發出的聲音來識別和分類它們。僅一次動作後,機器人的成功率就達到了 72%,但隨著每次連續的動作,其準確率飆升,在所有五個動作後達到 99.2%。機器人已經學會使用感知模型來識別和分類物體——並且它可以依靠這個模型來估計兩個物體僅憑它們發出的聲音的相似程度,從而指導它。

另一組實驗表明,機器人可以學會分辨某物是否是容器。該團隊向這臺機器展示了不同形狀的物體,機器頂部裝有一個 3D 攝像頭。透過在每個物體上掉落一個小方塊,然後推動它,機器人學會將物體分類為容器——當被推動時,與方塊一起移動的物體["共同移動"] 更頻繁——或非容器。然後,機器人可以使用這些知識來判斷不熟悉的物體是否可以裝東西;換句話說,它大致學會了如何辨別容器的獨特特徵。

當個人機器人最終進入零售連鎖店時,它們可能看起來像 HERB,這是在匹茲堡英特爾實驗室建立的“家庭探索機器人管家”。它是該公司個人機器人專案的一部分,該專案的目標是製造一個真正自主的機器人助手,它可以像人類一樣快速地在雜亂的環境(如家庭或辦公室)中執行日常任務。

這臺三英尺(一米)高的機器,在一個 Segway 個人運輸器的底座上平衡著一個 Barrett WAM 機械臂和一個 BarrettHand,並帶有兩個小型輔助輪。為了在動態環境中找到路徑,HERB 使用兩個雷射測距儀和一個攝像頭,使其能夠區分人和固定和可移動物體,如牆壁和椅子。(空間的粗略佈局圖首先被程式設計到機器人中。)透過觀察人們的移動方式,機器人使用學習演算法和機率分佈來預測他們下一步將要去哪裡,以避免與他們相撞。“HERB 知道人是有意圖的,他們不會只是直線移動,”英特爾研究科學家西德·斯里尼瓦薩,該專案的共同負責人之一說。為了弄清楚物體是什麼,HERB 將其即時攝像頭影像與其資料庫中的一組 3D 模型進行比較,這些模型是從研究人員之前向其展示的代表性影像構建的。

在雜亂的環境中操作物體,例如在房子裡搬運裝滿液體的水壺而不會灑出任何東西,需要兩種技能。首先,HERB 具有隨機規劃演算法,以確定儘快抓取或移動物體的最佳方式。例如,機器人可能有 30 秒的時間來“思考”拿起一個馬克杯的方法;如果它在 15 秒內找到一種方法,那麼它還有 15 秒的時間來改進其計劃。“它們不是最優演算法,但很實用,”斯里尼瓦薩說。

HERB 還使用模仿學習來弄清楚如何透過觀察人們如何處理物體來處理物體。“我們更擅長演示動作,而不是解釋它們,”斯里尼瓦薩說。“HERB 採集人類的例子並從中學習概括。它不僅僅是重複你正在做的事情。” 這有助於機器人處理新的、不熟悉的物品。在 10 月份為期一天的公開演示中,HERB 在一個模型廚房中移動,開啟櫥櫃和冰箱,並將物體遞給參觀者或放入回收箱——所有這些都只有幾次失誤。

斯里尼瓦薩最終希望 HERB 學習一些簡單的社會規則——例如知道繞過一群人而不是穿過他們——以及如何處理完全陌生的環境,即使在黑暗中也是如此。他估計,有用的機器人助手大約還需要十年時間。“摩爾定律”——英特爾聯合創始人戈登·摩爾在 1965 年首次提出的經驗法則,即晶片上的電晶體數量每兩年翻一番——“站在我們這邊。”他說

與此同時,學習型機器人有時會給自己的創造者帶來驚喜。斯里尼瓦薩講述了一個早期版本的 HERB 如何讓研究人員感到困惑,當時它正在抓取咖啡杯並將它們放入洗碗機架。它使用了一種奇怪的手部姿勢,其中一個“拇指”朝下。然後他們意識到這是一種“效率更高的運動”,專業調酒師使用這種運動,斯里尼瓦薩說:“他們從下方抬起並在一個流暢的動作中傾倒,就像電影《雞尾酒》中一樣。” 他稱這些驚喜為“進行操作研究的樂趣之一”。

© .