美國政府啟動耗資 1 億美元的“大腦阿波羅計劃”

情報專案旨在逆向工程大腦,以找到使計算機更像人類一樣思考的演算法

artificial intelligence

©iStock

三十年前,美國政府啟動了人類基因組計劃,這是一項為期 13 年的努力,旨在對人類物種的所有基因進行測序和繪製圖譜。儘管最初受到懷疑甚至反對,但該專案此後改變了遺傳學領域,如今被認為是歷史上最成功的科學事業之一。

現在,情報高階研究計劃署 (IARPA) 是一個為情報界設立的研究機構,效仿國防部著名的 DARPA,已投入 1 億美元用於一個類似規模的宏偉專案。“皮層網路機器智慧”計劃 (MICrONS) 旨在逆向工程大腦皮層一立方毫米的區域,研究其進行計算的方式,並利用這些發現來更好地改進機器學習和人工智慧領域的演算法。IARPA 已招募了三個團隊,分別由哈佛大學的生物學家和計算機科學家大衛·考克斯、卡內基梅隆大學的計算機科學家李太星和貝勒醫學院的神經科學家安德烈亞斯·託利亞斯領導。每個團隊都提出了自己解決這個問題的五年計劃。

“這是一項巨大的投資,因為我們認為這是一個至關重要的挑戰,並且[它將對]情報界以及更廣闊的世界產生變革性影響,”IARPA 的雅各布·沃格爾斯坦說,他負責管理 MICrONS 計劃。


支援科學新聞報道

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道: 訂閱。透過購買訂閱,您將幫助確保有關塑造我們當今世界的發現和想法的具有影響力的故事能夠持續下去。


MICrONS 作為奧巴馬總統“腦計劃”的一部分,旨在推動受大腦啟發的計算技術的現狀向前發展。當今的許多技術已經依賴於一類稱為人工神經網路的演算法,顧名思義,這些演算法的靈感來自大腦的結構(或至少是我們對大腦結構的瞭解)。由於計算能力的大幅提升以及網際網路上大量資料的可用性,Facebook 可以識別面孔,Siri 可以識別聲音,汽車可以自動導航,計算機可以在國際象棋等遊戲中擊敗人類。然而,這些演算法仍然很原始,依賴於高度簡化的資訊模式分析過程。根據追溯到 20 世紀 80 年代的模型,神經網路在雜亂的環境中往往表現不佳,在這些環境中,計算機試圖識別的物體隱藏在大量物體中,其中許多物體是重疊或模糊不清的。這些演算法的泛化能力也很差。例如,看到一兩個狗的例子並不能教會計算機如何識別所有的狗。

另一方面,人類似乎毫不費力地克服了這些挑戰。我們可以在人群中認出朋友,在嘈雜的環境中專注於熟悉的聲音,並根據一個或幾個例子推斷聲音或影像中的模式。我們不斷地學習泛化,而不需要任何指令。因此,MICrONS 的研究人員轉向大腦,以找到這些模型所缺失的東西。“這就是關鍵所在,”考克斯說。

雖然神經網路保留了大腦結構中的元素,但它們使用的計算並非直接複製自神經元用於處理資訊的任何演算法。換句話說,當前演算法表示、轉換和學習資料的方式是工程解決方案,主要由試錯法決定。它們有效,但科學家並不真正知道為什麼——當然不足以定義設計神經網路的方法。這種神經處理與大腦中相應的操作相似還是不同仍然未知。“因此,如果我們深入一層,從計算層面而不是僅僅從結構層面獲取大腦的資訊,我們可以增強這些演算法,使其更接近大腦般的效能,”沃格爾斯坦說。

各個團隊將嘗試繪製齧齒動物皮層一立方毫米區域內所有神經元之間的完整電路。這個體積不到人腦百萬分之一的大小,似乎非常小。但迄今為止,科學家們只能測量一次少數神經元的活動,或透過功能性磁共振成像獲得的複合影像中包含的數百萬神經元的活動。現在,MICrONS 的成員計劃記錄 10 萬個神經元的活動和連線性,同時齧齒動物正在進行視覺感知和學習任務——這是一項相對巨大的壯舉,因為它需要以奈米解析度對長度為幾毫米的電線彎曲和轉動進行成像。“這就像透過測量每一英寸來建立美國公路地圖,”沃格爾斯坦說。

儘管如此,沃格爾斯坦對近期對大規模神經科學研究的支援感到樂觀。“隨著‘腦計劃’的出現,大量的新工具已經上線,用於在恢復詳細電路圖所需的解析度和規模上探索大腦,”他說。“因此,現在是歷史上一個獨特的時刻,我們首次擁有了正確的工具、技術和科技,可以揭示大腦的佈線圖,精確到每個神經元和每個突觸的水平。”

每個團隊都計劃以不同的方式記錄大腦的路線圖。考克斯的團隊將使用一種稱為雙光子顯微鏡的技術來測量大鼠在接受訓練以識別計算機螢幕上的物體時的大腦活動。研究人員會將一種對鈣敏感的改良熒光蛋白引入齧齒動物體內。當神經元放電時,鈣離子會湧入細胞,導致蛋白質發出更亮的光——因此,使用雷射掃描顯微鏡,研究人員將能夠觀察神經元的放電情況。“這有點像竊聽大腦,”考克斯說。“就像你可能監聽電話來了解發生了什麼一樣,我們可以監聽大腦重要的內部方面,同時動物還活著並且正在做某事。”

然後,大鼠大腦的一立方毫米區域將被送到同樣在哈佛大學工作的生物學家和神經科學家傑弗裡·利希特曼手中。在利希特曼的實驗室裡,它將被切成非常薄的切片,並在最先進的電子顯微鏡下成像,解析度足以看到大腦細胞的所有線狀延伸,這些延伸相互連線。託利亞斯的團隊正在採用類似的方法,稱為三光子顯微鏡,以觀察小鼠大腦的更深層,而不僅僅是考克斯及其同事研究的頂層。

與此同時,李的團隊計劃採取一種更為激進的方式來繪製連線體。他們與哈佛醫學院的遺傳學家喬治·丘奇合作,計劃使用 DNA 條形碼技術:他們將用獨特的核苷酸序列(條形碼)標記每個神經元,並在突觸之間化學連線條形碼以重建電路。雖然這種方法無法提供與顯微鏡相同的空間資訊水平,但李希望它會更快、更準確——前提是它能起作用。這項技術以前從未成功使用過。“但如果這種條形碼技術奏效,它將徹底革新神經科學和連線體學,”李說。

而這一切僅僅構成了 MICrONS 專案的前半部分。科學家們接下來必須找到一種方法,使所有這些資訊對機器學習中的演算法有用。他們對如何做到這一點有一些想法。例如,許多研究人員認為大腦是貝葉斯式的——神經元以機率分佈的形式表示感覺資訊,根據先前的經驗計算事件最可能的解釋。這種假設主要基於大腦中的反饋迴路——資訊不僅向前流動,而且還有更多的連線向後流動。換句話說,研究人員假設感知不僅僅是從某些輸入到某些輸出的對映。相反,存在一個建設性的過程,“綜合分析”,在這個過程中,大腦維護和建立世界的內部表徵,產生期望和預測,使其能夠解釋傳入的資料並計劃如何使用它。“這是一個我們正在密切關注的指導原則——這種綜合過程的標誌,”考克斯說,“我們推測世界上可能存在什麼,並根據我們實際看到的東西來測試它,並用它來驅動我們的感知。”
 
例如,視網膜透過產生電脈衝來對光做出反應,電脈衝被傳遞到視神經,然後傳遞到大腦,而視網膜實際上是一個二維結構。因此,當一個人看到一個物體時,大腦可能會使用這種機率模型從照射到視網膜二維表面的光線中推斷出一個三維世界。如果是這樣,那麼大腦就找到了一種比我們當前的一組數學模型更擅長近似和推斷變數的方法。畢竟,如果你正在觀察一個有 100 個物體的場景,只考慮物體可能具有的前向和後向方向,這只是眾多方向中的兩個。那裡就有 2100 種可能的模式。透過計算所有這些機率來獲得答案是不可行的,然而大腦卻毫不費力地完成了這項工作,並且可以處理無限數量的可能方向:不同的距離、不同的旋轉、不同的光照條件。“大腦所做的是展開這個[資料點的]流形,並使其易於分離,”託利亞斯解釋說。

三個團隊中的每個團隊都招募了計算機科學家,將這些理論提煉成模型,然後他們將根據逆向工程的大腦資料對這些模型進行測試。“對於任何給定的演算法描述,例如機率演算法,您必須做出數百萬種實現選擇才能將該理論轉換為可執行的程式碼,”沃格爾斯坦說。“在這大約一百萬種選項中,某些引數和特徵的組合將產生好的演算法,而某些組合將導致低效或糟糕的演算法。透過從大腦中提取這些引數設定,而不是像[我們一直在做的那樣]在軟體中猜測它們,我們有望將空間縮小到與大腦一致的一小部分實現。”

憑藉這些內部模型,MICrONS 計劃使機器更加自動化,尤其是在訓練機器識別物體時,無需首先瀏覽數千個示例,在這些示例中,物品已按名稱識別。沃格爾斯坦希望將無監督學習技術應用於幫助美國情報部門。“我們可能只有一個圖片,或者一個我們想要預防的網路攻擊的單一示例,或者一個導致問題的金融崩潰或天氣事件的單一記錄,”他說,“我們需要推廣到可能出現相同模式的更廣泛的環境中。這就是我們希望實現的:更好的泛化、更好的抽象能力、更好地利用稀疏資料。”

雖然研究人員一致認為,從大腦中推匯出此類演算法將是 MICrONS 最困難的部分——他們將不得不確定一種編碼大腦如何處理資訊和形成新連線的方法——但即使在專案的早期階段,也仍然存在一些挑戰。首先,他們對大腦的測量將產生大約 2 PB 的資料——相當於 25 萬檯筆記本電腦或 250 萬張 CD 的記憶體。如此龐大的資料集的儲存將很困難,IARPA 已與亞馬遜合作尋找解決方案。此外,這些資料都是影像。挖掘其中的資訊將需要一個稱為分割的過程,在這個過程中,神經元的結構元素及其連線被分別著色,以便計算機可以更好地理解共享的特徵和模式。“即使全世界都在為你著色,”利希特曼說,“也需要一生的時間才能將整個立方毫米區域著色完成。”相反,研究人員將致力於建立更先進的計算機視覺技術來分割資料。

利希特曼已經在從丘腦(感覺資訊的接力站)的一部分生成的 100 TB 資料集(MICrONS 計劃收集的資料集的二十分之一)中看到了成功。他團隊的研究成果將於本月在《細胞》雜誌上發表。“我們瞭解到,有時相同的軸突會從一個細胞跳到另一個細胞,以接觸不同神經細胞上的相同位置,這表明丘腦的組織方式與人們預期的不同,”利希特曼說。也許這些結果將擴充套件到他們剛剛開始評估的皮層立方毫米區域。“我們知道我們可以處理大量資料,但現在我們將要做我們稱之為巨量資料的事情,”他說。“這是一個巨大的進步。我們認為我們已準備好邁出下一步。”

數學家、菲爾茲獎章獲得者、李的博士生導師大衛·芒福德沒有隸屬於 MICrONS,但他讚揚了這個專案。“這是真正的進步,”他說。“一旦此類資料集可用,那麼看到你可以在深入瞭解神經元相互作用的方式方面做些什麼是巨大的挑戰。大規模記錄在某個時候成為可能一直是我的夢想,我認為這個團隊很可能就是實現這一目標的團隊。”

“但我對將這些資訊轉移到人工神經網路的可能性持懷疑態度,”他補充道。“這有點遙遠。”

即便如此,所有三個團隊都對他們的工作將取得成果充滿信心。“無論結果如何——無論是什麼——都不是失敗,”利希特曼說。“它可能不符合你的預期,但那是一個機會。我並沒有因為我們的想法是否錯誤而失眠。沒有想法。只是大腦真的存在,它真的很複雜,而且以前從來沒有人真正見過它,所以讓我們來看看。這有什麼風險呢?”

他們還希望在 20 億美元投資的人腦工程專案中遇到的困難中取得成功。考克斯解釋說,他們的方法在技術上和後勤上都與人腦工程專案截然不同。事實上,透過首先觀察自然,然後再嘗試模擬大腦,他們基本上是以相反的方式工作的。而 MICrONS 基於團隊合作的方法有望產生取得重大進展所需的合作和競爭。IARPA 打算公佈其收集的資料,以便其他科學家可以貢獻想法和研究。“即使它像看一粒沙子,”李說,“正如我的大學教授告訴我的那樣,你可以在一粒沙子中看到上帝。”

編者注(2016 年 3 月 15 日):三個 IARPA 團隊之一——第二個團隊由李太星和喬治·丘奇領導——希望提供有關文章中提到的專案組織的更多細節,並提供了以下宣告。“每個團隊都處理該計劃的所有三個領域:(1)理論、生理學和機器學習;(2)資料收集;以及(3)資料處理。IARPA 根據三個團隊授予了六份獨立的 MICrONS 合同,分別授予:(1)哈佛大學,由大衛·考克斯領導;(2)卡內基梅隆大學和哈佛大學韋斯生物啟發工程研究所,分別由李太星和喬治·丘奇領導;以及(3)貝勒大學、艾倫腦科學研究所和普林斯頓大學,分別由安德烈亞斯·託利亞斯、克萊·裡德和塞巴斯蒂安·承領導。在三個團隊中,所有主要承包商都協同工作。這種組織的原因是不同的主要承包商具有不同的能力,因此他們根據需要組隊,以確保每個團隊都能完成專案的全部範圍。”

© .