IBM AI 與人類辯論——但它還不是口語界的“深藍”

正式辯論的來回交鋒仍然超出機器的“舒適區”——至少目前是這樣

Debate champion Harish Natarajan.

辯論冠軍哈里什·納塔拉詹在2019年2月的公司“Think 2019”會議期間,與IBM的人工智慧技術進行現場辯論。

2019年,哈里什·納塔拉詹參加了一場辯論,辯論物件是一個五英尺半高的矩形電腦螢幕,觀眾約有800人。這臺電腦是“辯論者專案”,這是IBM設計的人工智慧系統。納塔拉詹是全球公認的辯論冠軍。而當時的主題是學前教育是否應該獲得補貼。

根據觀眾投票,“辯論者專案”輸掉了比賽。但這個“它”表現出色,形成了邏輯清晰的開場陳述。2018年,“辯論者專案”贏得了一場辯論,並在另一場辯論中幾乎打成平手。儘管如此,該系統在與對手進行辯論和反駁時,仍然完全有可能聽起來很笨拙。

雖然計算機不會很快走上政治講臺,但今天發表在《自然》雜誌上的一項研究表明,這種演算法正逐漸接近於參與正式論證所代表的那種複雜的人類互動


支援科學新聞報道

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您將有助於確保未來能夠繼續報道關於塑造我們當今世界的發現和思想的有影響力的故事。


研究人員觀察到,辯論的要求超出了人工智慧的“舒適區”,人工智慧已經在各種棋類和影片遊戲中取得了勝利——更不用說著名的問答節目了。近幾十年來,人工智慧領域取得了驚人的進步。1997年,IBM的“深藍”成為第一臺擊敗衛冕國際象棋冠軍的計算機,在六局比賽中擊敗了泰坦級人物加里·卡斯帕羅夫。14年後,IBM的“沃森”在Jeopardy!問答節目中擊敗了全明星選手布拉德·魯特和肯·詹寧斯。

但許多競爭性計算機智慧已經在具有明確贏家和輸家的任務或遊戲中進行了測試。並且它很容易進行編碼,從而形成通往勝利的明確的二元演算法路徑。計算機科學家一直難以實現的是一種能夠與人類進行復雜對話的細微差別互動的系統。“辯論者專案”正接近這一目標。

在新的《自然》論文中,IBM的研究人員——包括該公司在以色列海法和愛爾蘭都柏林的人工智慧研究中心的合作團隊——報告了他們系統的進展。在2019年的辯論之後,虛擬觀眾的15名成員對“辯論者專案”和三位人類專家辯手在近80個不同主題上的演講進行了評估。

在這些人機對抗的比賽中,任何一方都不能訪問網際網路。相反,正如IBM研究院全球實驗室的傳播經理克里斯托弗·P·西亞卡所說,雙方各有15分鐘的時間“收集他們的想法”。這意味著人類辯手可以花一點時間記下關於手頭主題的想法,例如學前教育補貼,而“辯論者專案”則會梳理數百萬篇先前儲存的報紙文章和維基百科條目,分析特定句子以及關於特定主題的共同點和分歧。準備時間結束後,雙方輪流進行四分鐘的演講,然後每方進行兩分鐘的總結陳詞。

根據觀眾和讀者的評分,“辯論者專案”在2018年對陣三位專家之一時設法“獲勝”,並且在開場陳述中得分非常高。但總的來說,它仍然略遜於人類。障礙在於保持有意義的交流,這種交流可以朝任何方向發展,類似於真正的人類對話。儘管如此,研究結果仍在推動開發能夠理解和產生有意義的語言互動的人工智慧系統。

“近年來,在開發能夠理解和生成人類語言的演算法方面已經做了大量工作,”IBM研究院的傑出工程師,自“辯論者專案”啟動以來的首席研究員諾姆·斯洛尼姆說。“正在追求的任務範圍從預測單個句子的情感,到更復雜的任務,例如機器翻譯和對話系統。”他補充說,IBM的成果反映了一個系統,雖然仍然屈居於智人“對手”之下,但可以與對手進行互動,而這種互動在以前是其他人工智慧系統無法實現的。許多這樣的系統可以生成看似有意義的語言和實際的語法。但該領域的一個大問題是,機器是否能夠模仿實際的人類推理或變得有意識。

“在舞臺上,“辯論者專案”遠非完美,它的失誤揭示了辯論和辯論是多麼困難——以及多麼具有人類定義性,”蘇格蘭鄧迪大學的計算機科學家克里斯·裡德說,他沒有參與這項研究,但出席了2019年的辯論。“[然而] “辯論者專案”的研究是創新工程的傑作……IBM團隊取得的成就規模也從系統的現場表現中清晰可見:不僅使用從非常大的資料集中提取的知識,而且還即時響應人類的論述。”

納塔拉詹和其他辯手尚未準備好向“機器霸主”承認失敗。但無論是好是壞——人們希望是更好——機器學習正開始進入一個超越國際象棋和圍棋既定規則的領域。

Bret Stetka 是一位駐紐約市的作家,也是 Medscape Neurology(WebMD 的子公司)的編輯主任。他的作品曾發表在《連線》、NPR 和《大西洋》雜誌上。他於 2005 年畢業於弗吉尼亞大學醫學院。斯特卡於 2022 年去世。

更多作者:Bret Stetka
© .