Facebook 希望讓聊天機器人更健談

這家社交媒體巨頭正在將其語音人工智慧訓練資料開源

過去幾年,人們對聊天機器人如何徹底改變移動裝置傳遞資訊、實現線上購買和提供客戶服務的方式議論紛紛,但這些人工智慧應用程式在對話方面仍然不盡如人意。這是因為人與機器之間實現自然對話的能力——這種對話不僅僅是簡單的命令和預設回覆——仍然是一個正在進行的工作。然而,Facebook 希望透過建立一個共享平臺來訓練機器語音系統來改變這種情況。

聊天機器人——自動化的計算機程式,例如用於客戶服務或作為智慧手機上的個人助理——使用的對話大多是預先編寫的指令碼,Facebook 人工智慧研究 (FAIR) 團隊主管 Yann LeCun 說。“如果你偏離指令碼,它們表現就不太好。” 他補充說,其他型別的聊天機器人很有趣,但對於任何特定目的來說都不是很有用,他引用了微軟去年透過 Twitter 推出的 Tay AI,在它“學會”如何釋出冒犯性推文後,很快就下線了。“我們現在還沒有一個可以真正(學會)做一些有用的事情的聊天機器人,”LeCun 說。

LeCun 和他的團隊正在透過推出一個名為 ParlAI 的共享開源人工智慧訓練資料和程式庫,來幫助程式設計師開發下一代機器人。FAIR 研究科學家 Jason Weston 說,開發人工智慧的主要目標之一是建立能夠與人進行正常對話的智慧網路。“這項技術尚未成熟,因為缺乏一些基礎研究,包括開發可以訓練用自然語言說話的人工智慧對話演算法,而不是預設的回覆。”


關於支援科學新聞

如果您喜歡這篇文章,請考慮透過 訂閱 來支援我們屢獲殊榮的新聞報道。透過購買訂閱,您正在幫助確保關於塑造我們當今世界的發現和想法的具有影響力的故事的未來。


ParlAI 推出了 20 個不同的資料集,研究人員可以使用每個資料集來教人工智慧對話系統執行特定任務,無論是幫助聊天機器人學習如何回答問題,還是收集執行任務所需的資訊(例如預訂餐廳)。其中一個數據集——bAbI 任務——包括 20 個不同的測試,旨在衡量例如當呈現一系列句子並被問及有關文字的問題時,人工智慧應用程式如何 理解和推斷含義。Weston 說,人工智慧代理需要能夠理解正在發生的事情並使用推理來回答問題。

一些資料集僅包含文字;另一些資料集包含影像和文字,旨在透過將單詞與現實世界中的事物聯絡起來來教語言,LeCun 說。ParlAI 旨在為研究人員提供一個統一的框架來訓練和測試對話模型,特別是同時對多個數據集進行多工訓練,他補充說。“我們希望這些任務的結合將幫助機器獲得更多知識。”

麻省理工學院 計算機科學與人工智慧實驗室 互動機器人小組的博士後研究員 布拉德·海耶斯(他沒有參與 Facebook 的工作)說,圍繞機器學習和對話系統的炒作已經超過了該領域的現實。“語言理解是一個非常廣泛的主題,建立功能性聊天機器人不僅需要理解語言背後的含義,還需要綜合相關回應的能力。”

公開資料集將使更廣泛的參與者能夠解決這些問題,但海耶斯表示,更成功的語言理解和使用的發展不僅僅是將更多的訓練資料輸入到現有系統中。這些限制在使用者必須使用簡單的方式說話才能被聊天機器人和諸如 Amazon Alexa 之類的智慧助手理解時最為明顯。“一個很好的例子是:你可以要求 Alexa 調高或調低音量,或者將其設定為 0 到 10 之間的數字。但它不理解百分比,也無法將百分比映射回軟體使用的內部比例,”他說。當程式設計師試圖規定使用者應該如何與裝置交談,而不是為更自然的互動進行設計時,這是一個危險。

Facebook 試圖解決這個陷阱的一種方法是允許 ParlAI 的參與者透過讓人工智慧應用程式透過 Amazon Mechanical Turk 與人互動來測試其對話能力,Amazon Mechanical Turk 是一個眾包平臺,它利用人類智慧來執行計算機目前無法執行的任務。Weston 說,最終,製作健談的機器人和人工智慧代理的能力取決於它們的設計和訓練程度,這需要研究人員瞭解他們的程式如何與真實的人互動。

健全的聊天機器人開發策略對於該技術的發展至關重要。隨著自動化聊天系統進入廣泛使用,聊天機器人將對未來訊息傳遞、支援或一線服務專案的生存至關重要,海耶斯說,但有一個重要的注意事項。“聊天機器人可以顯著改進 [客戶服務] 系統,並充當人類努力的倍增器,但如果過早部署,也可能破壞使用者體驗和品牌聲譽。”

© .