谷歌、Facebook 和其他企業巨頭正在構建可以自主學習的技術方面取得重大進展。他們的努力很大程度上依賴於一種被稱為深度學習的技術。
深度學習網路源於數十年前的觀點,即如果計算機的執行方式更像人腦,它們就會更智慧。深度學習網路由一層又一層的連線計算機處理單元(稱為人工神經元)組成,每個單元對當前輸入(例如,要分類的影像)執行不同的操作。傳統神經網路和深度學習神經網路之間的區別在於後者具有更多層。網路越深——層數越多——它可以操作的抽象級別就越高。
深度學習在 2000 年代中期透過三位關鍵人物的工作獲得了發展勢頭——多倫多大學的 Geoffrey Hinton、蒙特利爾大學的 Yoshua Bengio 和紐約大學的 Yann LeCun——但直到最近才開始在商業上取得進展。一個例子是 5 月份推出的 Google 相簿應用。該軟體可以上傳我 iPhone 中的所有影像,正確識別我的妻子、兒子和孫子,然後將他們的照片轉儲到以縮圖標記的單獨數字箱中。它可以做到這一點,因為它透過暴露於數百萬張由系統分析的影像中,學會了識別人臉。當它在網路的每個連續層中執行影像時,該軟體會以越來越高的抽象級別識別影像中的元素,直到最終可以檢測到圖片中的整張臉。
關於支援科學新聞
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞事業 訂閱。透過購買訂閱,您正在幫助確保未來能夠繼續講述關於塑造我們當今世界的發現和想法的具有影響力的故事。
一旦它接受了足夠的人臉訓練,它就可以在以前從未見過的影像中識別出每個人的鼻子和嘴巴。
深度學習的功能遠不止整理圖片。事實上,它可能標誌著朝著人工智慧邁進了一步,人工智慧表現出的智慧行為幾乎與其人類主人的智慧行為無法區分。今年 2 月,倫敦公司 DeepMind(谷歌於 2014 年以 6.17 億美元收購)的一個人工智慧專家團隊報告稱,它已使用深度學習構建了一臺可以自學玩數十款雅達利影片遊戲的計算機。經過大量練習,該軟體在其中一半遊戲中擊敗了專家級人類玩家。這是一小步,但機器時代必須從某個地方開始。