使用光而不是電來構建計算機的想法可以追溯到半個多世紀以前。“光學計算”長期以來一直承諾比傳統電子計算機更快地執行計算,同時消耗更少的能量。然而,由於科學家們一直在努力製造出能夠超越現有計算機的光基元件,因此,實際光學計算機的前景一直不被看好。儘管遇到了這些挫折,光學計算機現在可能會有一個新的開始——研究人員正在測試一種新型的光子計算機晶片,它可以為像自動駕駛汽車一樣智慧,但小到可以放入口袋的人工智慧裝置鋪平道路。
傳統計算機依賴於電子電路,這些電路相互開啟和關閉,以仔細編排的方式對應於,例如,兩個數字的乘法。光學計算遵循類似的原理,但不是電子流,而是由光子束執行計算,光子束彼此相互作用,並與透鏡和分束器等引導元件相互作用。與必須在電阻的潮流中流經電路的曲折的電子不同,光子沒有質量,以光速傳播,並且一旦產生,就不會消耗額外的能量。
麻省理工學院的研究人員在《自然光子學》雜誌上發表文章,最近提出,基於光學的計算將特別有助於增強深度學習,深度學習是人工智慧近期許多進展的基礎技術。深度學習需要大量的計算:它需要將大量資料集輸入到基於人腦神經結構的大型模擬人工“神經元”網路中。每個人工神經元接收一系列數字,對這些輸入執行簡單的計算,並將結果傳送到下一層神經元。透過調整每個神經元執行的計算,人工神經網路可以學習執行各種各樣的任務,例如識別貓和駕駛汽車。
關於支援科學新聞
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保有關塑造我們當今世界的發現和想法的具有影響力的故事的未來。
深度困境
深度學習已經成為人工智慧的核心,包括谷歌和高效能晶片製造商英偉達在內的公司已經投入數百萬美元開發專門用於深度學習的晶片。這些晶片利用了人工神經網路的大部分時間都花在“矩陣乘法”上的事實——矩陣乘法是指每個神經元對其輸入求和的操作,每個輸入都有不同的值。例如,在面部識別神經網路中,一些神經元可能正在尋找鼻子的跡象。這些神經元會給對應於小的、黑暗區域(可能是鼻孔)的輸入賦予更大的值,給光斑(可能是皮膚)賦予略低的值,而給霓虹綠色(極不可能裝飾某人的鼻子)賦予非常小的值。一種專門的深度學習晶片透過將這些加權總和分配到晶片的數百個小型獨立處理器中,同時執行許多這些加權總和,從而顯著加快了速度。
這種型別的工作負載需要相當於一臺小型超級計算機的處理能力。奧迪和其他製造自動駕駛汽車的公司有奢侈的時間將整排計算機塞進後備箱,但要想將這種處理能力裝入人工智慧無人機或手機中,那就祝你好運了。即使神經網路可以在大型伺服器場上執行,例如谷歌翻譯或 Facebook 的面部識別,這種重型計算也會產生數百萬美元的電費。
2015 年,麻省理工學院的博士後研究員,同時也是這篇新論文的主要作者沈逸辰(音譯)正在尋找一種新的深度學習方法,以解決這些功率和尺寸問題。他偶然發現了共同作者尼古拉斯·哈里斯(Nicholas Harris)的工作,後者是麻省理工學院電氣工程和計算機科學專業的博士生,他構建了一種新型的光學計算晶片。儘管之前的大多數光學計算機都失敗了,但沈逸辰意識到,可以將光學晶片與傳統計算機混合使用,為深度學習開闢新的前景。
雜交計算機
許多研究人員早就放棄了光學計算。從 20 世紀 60 年代起,貝爾實驗室和其他公司花費了大量資金設計光學計算機部件,但最終他們的努力幾乎沒有帶來任何好處。“光學等效電子電晶體從未被開發出來,”上阿爾薩斯大學光學計算教授皮埃爾·安布斯說,並且光束無法執行基本的邏輯運算。
然而,與之前的大多數光學計算機不同,哈里斯的新晶片並沒有試圖取代傳統的 CPU(中央處理單元)。它旨在僅為量子計算執行專門的計算,量子計算利用亞原子粒子的量子態來比傳統計算機更快地執行某些計算。當沈逸辰參加哈里斯關於新晶片的演講時,他注意到量子計算與阻礙深度學習的矩陣乘法相同。他意識到深度學習可能是幾十年來光學計算一直無法實現的“殺手級應用”。受到啟發,麻省理工學院的團隊將哈里斯的光子晶片連線到一臺普通計算機,允許深度學習程式將其矩陣乘法解除安裝到光學硬體。
圖片來源:尼古拉斯·哈里斯
當他們的計算機需要進行矩陣乘法(即,對一些數字進行一堆加權求和)時,它首先將這些數字轉換為光學訊號,較大的數字表示為更亮的光束。然後,光學晶片將整個乘法問題分解為許多較小的乘法,每個乘法由晶片的單個“單元”處理。要理解單元的操作,請想象有兩條水流流入其中(輸入光束),兩條水流流出。該單元的作用類似於閘門和泵的晶格——分割水流,加速或減速,並將它們混合在一起。透過控制泵的速度,單元可以將不同量的水引導到每個輸出水流。
泵的光學等效物是加熱的矽通道。哈里斯解釋說,當加熱時,“[矽]原子會稍微擴散開,這會導致光以不同的速度傳播”,從而導致光波相互增強或抑制,就像聲波一樣。(抑制後者是降噪耳機的工作原理。)傳統的計算機設定加熱器,使得每個單元的輸出通道中流出的光量是輸入的加權總和,加熱器決定權重。
要有光?
沈逸辰和哈里斯透過訓練一個簡單的神經網路來識別不同的母音來測試他們的晶片。結果平平,但沈逸辰將其歸因於重新利用了不完全合適的裝置。例如,用於將數字轉換為光學訊號和從光學訊號轉換為數字的元件是粗略的概念證明,之所以選擇它們僅僅是因為它們很容易連線到哈里斯的量子計算晶片。根據他們在《自然光子學》雜誌上的論文,專門為深度學習製造的更完善的計算機版本可以提供與最佳傳統晶片相同的精度,同時將能耗降低幾個數量級,並提供 100 倍的速度。這將使即使是手持裝置也能內建人工智慧功能,而無需將繁重的工作外包給大型伺服器,否則這將幾乎是不可能的。
當然,光學計算的坎坷歷史為持懷疑態度留下了充足的空間。“我們不應該過於興奮,”安布斯警告說。沈逸辰和哈里斯的團隊尚未展示完整的系統,安布斯的經驗表明,有時“很難如此大幅度地改進基本系統”。
儘管如此,即使安布斯也認為這項工作“與 90 年代的 [光學] 處理器相比取得了巨大進步”。沈逸辰和哈里斯也很樂觀。他們正在創辦一家初創公司以將他們的技術商業化,並且他們相信更大的深度學習晶片會起作用。哈里斯認為,他們將當前晶片的錯誤歸咎於的所有因素都有已知的解決方案,因此“這只是一個讓合適的人參與並實際構建它的工程挑戰”。
