谷歌的線上翻譯服務谷歌翻譯很快將使用一種完全基於深度學習的新演算法,該公司在9月27日宣佈。 該演算法也在發表在預印本伺服器 arXiv 上的一篇論文中進行了描述,它是第一個廣泛可用的、用於翻譯語言的計算機系統,依賴於日益流行的 AI 技術。 谷歌計算機科學家表示,與該公司現有的服務相比,該演算法將錯誤率降低了約 60%。
一種使用該演算法的中文到英文翻譯服務現在正在谷歌翻譯的移動和網路應用程式上使用,谷歌表示將在未來幾個月內推出其他語言。
這項進步是深度學習成功的又一個例子,近年來,它透過將人工神經網路(模仿大腦中神經元連線方式的計算單元層)與龐大的資料集相結合,幫助解決了重大的 AI 問題。 最值得注意的是,該技術在影像識別和遊戲方面擊敗了其他機器方法。 谷歌現在將相同的方法應用於語言翻譯,建立了所謂的神經機器翻譯系統 (NMTS)。 “從輸入到輸出,全部由一個神經網路完成,”位於加利福尼亞州山景城的谷歌計算機科學家 Quoc Le 說,他幫助開發了 NMTS。
關於支援科學新聞
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道: 訂閱。 透過購買訂閱,您將有助於確保有關當今塑造我們世界的發現和想法的具有影響力的故事的未來。
NMTS 借鑑了其他人在機器學習方面的進展,並添加了一些方法論上的新穎之處,加拿大蒙特利爾大學的計算機科學家 Yoshua Bengio 說,他讀過 arXiv 的論文。 “乍一看,他們似乎已經掌握了大部分已知技巧,”他說。 該團隊的主要成就是證明“透過可靠的工程和精心設計的架構,神經機器翻譯可以遠遠超過機器翻譯的經典方法”,他說,並取得了“相當驚人的結果”。
瑞士盧加諾大學(也稱為 USI)的計算機科學家 Jürgen Schmidhuber 說,該演算法“在許多方面確實改進了最先進的技術”。
機器翻譯
公司發言人 Charina Choi 說,到目前為止,谷歌翻譯對人工神經網路的使用是有限的。 在大多數情況下,其演算法逐字分析文字,透過搜尋數百萬現有翻譯(例如來自聯合國或歐洲議會的檔案)來學習關聯不同語言中的對應單詞。
NMTS 還透過分析現有翻譯來學習; 在此過程中,它會調整人工神經元之間的連線,從而提高其效能。 但它會透過首先將每個單詞分解為“詞段”來分析句子,這個想法來自該團隊成員 Mike Schuster,他也在山景城的谷歌工作,他將其應用於語音識別軟體。
“不知何故,在神經網路內部的某種表示中,這些詞段可以組合起來表示含義,”Le 說。 這可能類似於神經網路執行諸如人臉識別之類的視覺任務的方式:它們從影像中的單個畫素開始,然後逐漸處理更復雜的特徵,例如邊緣、幾何圖案等等。
分析文字的同一個神經網路會生成翻譯。 為了提高速度,該公司在專門為機器學習設計的計算機晶片上執行該系統。 今年早些時候,在圍棋比賽中擊敗頂尖人類棋手的程式 AlphaGo 使用了類似的硬體。
效能評估
為了評估翻譯系統的效能,谷歌研究人員從維基百科和新聞文章中提取句子,並將 NMTS 製作的翻譯(在少數不同的語言對之間)與公司舊系統和人工翻譯製作的相應翻譯並排比較。 然後,該團隊讓人工評估員在盲測中對翻譯質量進行評分。
眾所周知,中文到英文的翻譯非常困難,顯示出顯著改進,但與該演算法在印歐語言之間的翻譯相比仍然滯後。 對於其他一些語言對,NMTS 的準確性接近人工翻譯的水平,儘管作者警告說,該測試的意義受到精心製作的簡單句子樣本的限制。
Schmidhuber 認為,只有當機器能夠結合不同的感官輸入時,它們才能真正與人類的翻譯水平相匹配或超越人類。 “今天,他們只看到諸如‘貓從樹上掉下來’之類的句子,”Schmidhuber 說。 “未來,他們還將看到貓從樹上掉下來的影片,他們將控制能夠看到、聽到、移動和操縱物體的機器人,並透過疼痛感測器感受疼痛,並將他們的經歷與文字聯絡起來。”
本文經許可轉載,並於 2016 年 9 月 27 日首次釋出。
