各種形狀和尺寸的機器人越來越多地出現在工作場所,從工廠到手術室。許多機器人依賴於透過機器學習,透過反覆試驗來獲得新技能。一種新方法有助於在形狀不同的機器人之間轉移此類技能,避免了每次都從頭開始學習任務。“實際上,這很重要,”卡內基梅隆大學計算機科學家、這項研究的主要作者劉星宇 (Xingyu Liu) 說,該研究於今年夏天在國際機器學習會議上發表。“從研究的角度來看,我認為這是一個很酷的基礎問題,值得研究。”
假設你有一個帶有類人手的機器人手臂。你已經訓練它的五根手指拿起錘子,將木釘敲入木板。現在你想讓一個兩指夾爪做同樣的工作。科學家們在兩者之間建立了一種模擬機器人橋樑,其形狀從原始形狀緩慢轉變為新形狀。每個中間機器人都會練習指定的任務,調整人工神經網路,直到其達到成功的閾值率,然後控制器程式碼才會傳遞到鏈中的下一個機器人。
為了在虛擬源機器人和目標機器人之間轉換,該團隊建立了一個共享的“運動樹”——一組節點,代表由代表關節的連結連線的肢體部分。為了將錘擊技能轉移到兩指夾爪,該團隊將其中三個手指的節點尺寸和權重調整為零。在每個中間機器人中,手指的尺寸和重量都變得小一點,並且控制它們的網路必須學會調整。研究人員還調整了他們的訓練方法,使機器人之間的飛躍不會太大或太小。
支援科學新聞業
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞業: 訂閱。透過購買訂閱,您將幫助確保有關當今塑造我們世界的發現和想法的具有影響力的故事的未來。
卡內基梅隆系統名為 REvolveR(代表機器人-進化-機器人),其效能優於基準訓練方法,例如從頭開始教導目標機器人。為了在使用夾爪、在錘擊任務以及其他涉及移動球和開門的實驗中達到 90% 的成功率,即使替代方法使用了更豐富的資訊性訓練反饋,最佳替代訓練方法也比 REvolveR 多需要 29% 到 108% 的試驗次數。在進一步的實驗中,研究人員在其他型別的虛擬機器人上測試了他們的過程,例如為蜘蛛狀機器人新增新的腿部,並讓它重新學習如何爬行。
牛津大學計算機科學家維塔利·庫林 (Vitaly Kurin) 說:“我認為這個想法很好。”他研究機器人技術和機器學習,但未參與這項工作。他說,儘管安排挑戰以便 AI 可以在任務之間轉移技能並不新鮮,但“這種從一個機器人內插到另一個機器人以進行轉移的方法是我以前沒有想到的。”
