在大型腦圖譜計劃中,臺灣的專案可能顯得規模較小。那裡的科學家正在研究不起眼的果蠅,從單個神經元的影像中逆向工程其大腦。他們的努力已經產生了令人驚歎的詳細大腦回路3D圖譜。
研究人員只需一臺電腦滑鼠和網路瀏覽器,即可定位到單個細胞,並縮小到相互交織的神經束網路。這些線路圖看起來像是掛毯上色彩鮮豔的絲線,清晰到足以顯示哪些細胞簇控制著特定的行為。透過刺激特定的神經迴路,研究人員可以提示果蠅拍動左翼或左右擺動頭部——這些壯舉在11月於加利福尼亞州聖地亞哥舉行的神經科學學會年會上引起了下午晚些時候人群的歡呼。
但即使對於如此小的生物,該團隊也花了整整十年時間才對60,000個神經元進行成像,每個細胞的資料量為1千兆位元組,專案負責人、臺灣新竹市國立清華大學的神經科學家蔣安世說——而這甚至還不到果蠅大腦中神經細胞的一半。蔣安世在會議上報告說,如果使用相同的方案對人腦中860億個神經元進行成像,估計需要1700萬年。
支援科學新聞事業
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道: 訂閱。透過購買訂閱,您將幫助確保關於塑造我們今天世界的發現和想法的具有影響力的故事能夠擁有未來。
其他技術更易於處理。2016年7月,一個國際團隊釋出了人腦褶皺外層——大腦皮層的圖譜1。許多科學家認為這項成果是迄今為止最詳細的人腦連線圖譜。然而,即使在其最高的空間解析度(1立方毫米)下,每個體素——3D物體中最小的可區分元素——也包含數萬個神經元。這與在果蠅中以單細胞解析度繪製的神經連線相去甚遠。
“如果你認為大腦解剖學是一個已解決的問題,那就聽我們的——事實並非如此,”馬薩諸塞州查爾斯鎮馬薩諸塞州總醫院的神經科學家、美國政府資助的全球聯盟“人類連線組計劃”(HCP)的首席研究員範·韋登說,該聯盟釋出了腦圖譜。
神經生物學領域的情況就是如此,大資料確實非常龐大。儘管計算基礎設施和資料傳輸方面取得了進展,但神經科學家仍在努力應對他們版本的“大資料”革命,這場革命在幾十年前席捲了基因組學領域。
但腦圖譜繪製和DNA測序是不同的。單個神經影像資料集的容量可以達到太位元組級別——比完整的哺乳動物基因組大兩到三個數量級。雖然遺傳學家知道他們何時完成了一個DNA片段的解碼,但腦圖譜繪製者缺乏明確的停止點,並且需要處理更豐富的成像和電生理資料——同時還要爭論收集、共享和解釋這些資料的最佳方法。然而,隨著科學家開發出共享和分析不斷擴充套件的神經科學資料集的工具,他們逐漸達成了一個共識:破解大腦需要協同努力。
科學家可以在多個層面上繪製大腦圖譜。HCP 尋求使用磁共振成像 (MRI) 在宏觀尺度上繪製大腦連線圖。一些實驗室正在微觀尺度上繪製神經通路圖,而另一些實驗室(如蔣安世的實驗室)則以奈米級精度追蹤每個突觸和神經分支。還有一些實驗室正在努力將基因表達模式、電生理測量或其他功能資料疊加到這些圖譜上。這些方法使用了不同的技術——但都產生了大資料(見“大資料的資料”)。
有多大?
部分原因是,無論是哪個物種,大腦都非常龐大且相互連線。但這也源於細胞難以控制的尺寸。哺乳動物神經元的主要延伸部分——軸突——的長度可以是其最小分支(稱為樹突)寬度的 200,000 倍。如果按比例構建一個模型,用義大利麵條代表樹突,那麼神經元本身將超過三分之一公里長,或相當於四個美式橄欖球場。
在實驗室中,研究人員透過追蹤每個神經元在數百張重疊的腦切片影像堆疊中的數千個投射來繪製其圖譜。基於光學的顯微鏡可提供 0.25–0.5 微米的解析度,足以追蹤單個神經元的主體。但要揭示突觸——電訊號或化學訊號流經的微小訊號連線——則需要奈米解析度的電子顯微鏡。更高的解析度意味著更小的視野,因此需要更多的圖片。而更多的圖片意味著更多的資料。
“我們不再處理兆位元組,甚至千兆位元組的資料,”洛杉磯南加州大學神經影像實驗室負責人亞瑟·託加說。“我們正在處理太位元組的資料。僅僅將資料從一個地方傳輸到另一個地方就是一個問題”——2 太位元組的資料將填滿許多臺式電腦的硬碟驅動器。
蔣安世的果蠅團隊梳理了 1 太位元組的影像,重建了 1,000 個神經細胞——不到果蠅大腦的 1%。HCP 聯合首席研究員、明尼阿波利斯明尼蘇達大學的卡米爾·烏格比爾說,為了繪製人腦皮層圖譜,HCP 研究人員分析了來自 210 名健康年輕人的 6 太位元組 MRI 資料。實驗室可以從該專案的網站下載這些資料,或者對於更大的資料集,可以訂購 8 太位元組的硬碟驅動器,每個售價 200 美元。
電生理學研究也變得對計算要求很高。如今,研究人員通常一次記錄數百個神經元。瑞士日內瓦大學的神經科學家亞歷山大·普傑說,很快,這個數字將達到數千個;五年後,將達到數十萬個。“這就是我們將要經歷的飛躍。”
這些資料以多種格式呈現。大腦活動可以表現為電生理圖表上波浪線中的峰值,或者表現為鈣離子在神經元內外移動時發出的綠色閃光。在這些綠色影像上,其他熒光色調可以指示哪些神經元正在傳送和接收訊號。研究人員可以在受試者在迷宮中導航、尋找食物或觀看螢幕上閃爍的點時收集這些資料。
哈佛大學劍橋分校的神經科學家弗洛裡安·恩格特說,如果你記錄小鼠大腦中 20 分鐘的神經活動,你將產生大約 500 拍位元組的“閃爍”,其中神經細胞的放電被表示為畫素值的變化。但“沒有人關心畫素。人們感興趣的是哪些神經元與其他神經元相連,以及它們何時放電。”他說,透過隔離每個神經元並分配它們放電的時間戳,你可以將資料集縮小到更易於管理的 500 千兆位元組。
“原始資料中的資訊內容大多無關緊要,”恩格特說。他用基因組測序作了一個類比:在他們擁有自動測序儀之前,研究人員將 DNA 讀取為在暴露於 X 射線膠片的聚丙烯醯胺凝膠上的有序條帶模式。現在,計算機演算法將這些條帶轉換為 G、A、T 和 C 的序列——構成 DNA 鏈的鹼基——並且沒有人儲存原始影像。恩格特說,同樣,腦科學家應該“專注於開發演算法,而不是管理和分發原始資料”,以使用更少的位元來編碼資訊。他說,理想情況下,這樣的演算法將使收集資料的顯微鏡也能夠壓縮資料。
這個想法是明智的,但對於大腦來說可能具有挑戰性,部分原因是數學。例如,為了使用 X 射線晶體學確定蛋白質結構,存在一個“非常清晰的理論模型”——一系列方程,將蛋白質的特定特徵與其衍射模式中的可量化特徵相關聯,美國馬里蘭州羅克維爾國家心理健康研究所 (NIMH) 資料檔案館的格雷格·法伯說。為了計算出 3D 結構,“你只需測量光點的強度。你不需要保留膠片上許多其他畫素的資料,”他說。
神經科學家沒有可比的模型——沒有將神經連線和活動與行為、記憶或認知聯絡起來的圖譜。法伯說,鑑於大腦的巨大複雜性,問題“不是我們有太多資料,而是對於我們試圖解決的複雜性而言,我們的資料還遠遠不夠”。
“資料不足”的問題引起了猶他州鹽湖城猶他大學研究神經發育障礙的系統神經科學家朱莉·科倫伯格的共鳴。關於此類疾病的一個普遍假設是,基因的變化會使某些神經元中的蛋白質表達發生偏差,進而改變大腦的佈線,從而導致典型的行為缺陷。MRI 可以檢測到明顯的神經解剖學變化,例如腦區擴大。但更細微的變化需要更高解析度的方法,例如共聚焦或電子顯微鏡。但這些成像資料以完全不同的格式表示,並且無法在兩者之間切換:一旦科學家放大到單個細胞的水平,他們就無法再次縮小以在整個大腦的背景下看到這些細胞。
搭建橋樑
在過去的 17 年裡,科倫伯格和她的同事一直在努力彌合這一差距,方法是繪製獼猴邊緣系統的圖譜。這些靈長類動物的大腦中有 60 億個神經元,而人腦中有 860 億個神經元。但在研究模型中,獼猴是我們最近的親屬——比小鼠或果蠅親近得多。
科倫伯格的團隊正在開發一個 3D 座標系統,以對齊獼猴大腦中各種型別的神經影像資料,從全腦 MRI 連線到單細胞共聚焦資料,以及某些區域的亞細胞解析度電子顯微鏡資料。NIMH 情感、社會行為和社會認知專案負責人珍妮·西蒙斯說,他們正在建立一個“允許您在一個影像上選擇一個點,並在另一個解析度下檢視同一點的系統”,該專案部分資助了科倫伯格的專案。西蒙斯說,這類似於谷歌地球——例如,你可以從 40 倍直接放大到 1 倍,但不一定能訪問中間的放大倍數。
使用 20 倍共聚焦鏡頭繪製整個獼猴邊緣系統的圖譜將需要海量資料集——每隻動物超過 600 太位元組。到目前為止,該團隊已收集了約 100 太位元組的資料,這些資料可以從網路連線的儲存裝置訪問,該裝置將本地 30 太位元組伺服器與雲端儲存相結合。科倫伯格說,研究人員可以使用縮減的資料集和一臺好的筆記型電腦來解決一些問題。但操作大型 3D 共聚焦資料集需要特殊的工作站,即便如此,渲染單個平鋪影像也很慢。
紐約市西奈山醫學院的神經解剖學家帕特里克·霍夫說,這項尚未發表的工作“有可能成為連線組學領域的一項重大進步”,他以前曾與科倫伯格合作過。科倫伯格說,例如,這些資料可以幫助科學家將似乎在某些精神疾病(如精神分裂症或自閉症)中重要的基因與特定的腦佈線異常聯絡起來。
隨著科學家們突破可能的界限,他們正在建立計算管道來處理不斷擴充套件的工作流程,並開發新的工具——例如 Thunder 和 BigDataViewer——來共享和視覺化結果資料。但僅靠工具開發還不足以緩解神經科學家的資料困境。還需要文化轉變。斯坦福大學的心理學家羅素·波爾德拉克說,很難“讓人們放手他們的資料”,他使用神經影像學來研究學習和記憶。他說,這可能是“一代人的事情”:千禧一代“比我這一代人更熱衷於共享程式碼和資料”。波爾德拉克擔心,頂尖人才可能會因為對科學“不符合他們認為應該具有的價值觀”感到沮喪而離開這個領域。
但態度正在緩慢轉變——首先是對軟體的態度,然後是對資料的態度。傳統上,神經影像實驗室花費大量時間下載和安裝相同的測試版軟體,“破解各種軟體故障和計算瓶頸,編寫冗餘的程式碼塊,並實施他們自己的資料管理解決方案來解決相同的問題”,加州大學戴維斯分校的神經科學博士生大衛·格雷森說。更糟糕的是,許多非研究任務被下放給學生、博士後和年輕研究人員,他們往往精通技術,但“並非報名成為系統管理員”,格雷森說。
國際神經資訊學協調機構 (INCF) 是一個總部位於斯德哥爾摩的非營利組織,成立於 2005 年,旨在為全球大腦研究人員開發和推廣標準、工具和基礎設施。幾年後,美國啟動了神經影像資訊學工具和資源交換中心 (NITRC),作為一個共享神經影像計算工具的平臺。NITRC 專案經理妮娜·普魯斯說,那時“沒有人甚至考慮過共享資料,只考慮過軟體”,NITRC 總部設在華盛頓特區。
這種情況在 2009 年底發生了變化,當時紐約州奧蘭治堡內森·S·克萊恩精神病研究所的研究人員將來自 1,200 多名志願者的靜息態功能性 MRI (fMRI) 資料釋出到 NITRC 中,這些資料是為 1000 功能連線組專案 (FCP) 收集的。這些只是彙總的原始資料——但在幾周內,NITRC 使用者已下載該資料集 700 次。“人們對可以自由下載和使用的資料有著如此強烈的潛在需求,”普魯斯說。
一旦作者清理了 fMRI 資料並使其可搜尋,下載量就飆升至數千次。在資料發表2後,該論文在最初 2 周內記錄了 1,000 多次下載。同年,獨立作者——他們下載了該聯盟的 fMRI 資料用於自己的分析,但未參與資料收集——的第一篇論文也發表了3。
自 HCP 於 2013 年 3 月首次釋出資料集以來,數十家外部實驗室發表了分析該專案資料的論文。密蘇里州聖路易斯華盛頓大學醫學院的專案外聯協調員詹妮弗·埃拉姆說,HCP 總共釋出了約 50 太位元組關於 1,000 多人的腦影像資料。
然而,很少有小規模專案釋出他們的資料——可能是因為他們沒有必要這樣做。一些期刊要求公開所有支援已發表研究結果的資料,但總的來說,資料共享並沒有得到激勵。格雷森說,沒有“強大的動力”去做那一點額外的工作。
傳統的學術模式也無濟於事。研究人員通常獨立於他們小組中的同行,提出假設並研究自己的想法。華盛頓州西雅圖艾倫腦科學研究所的曾紅葵說,在這種環境中,研究不會將人們聚集在一起——而是將他們分開。“你需要讓自己與眾不同。為了在該領域確立你的身份,你必須做一些與其他人不同的事情。”
曾紅葵於 2006 年加入艾倫研究所,尋求文化變革:該研究所制定了雄心勃勃的五年目標,要求團隊協作和系統地工作,推動專案完成,而不是像在個人實驗室中那樣零敲碎打。
就大腦而言,“完整”可能是一個不斷變化的目標。但神經科學工具集也是如此。蔣安世在他的神經科學學會演講中感嘆,繪製一半果蠅大腦圖譜花了十年時間。蔣安世的團隊與臺灣中央研究院的物理學家合作,開始使用一種稱為同步加速器 X 射線斷層掃描的技術來大幅提高資料採集速度。
蔣安世說:“對包含數千個高爾基染色單個神經元的果蠅大腦進行成像只需不到 10 分鐘。”他的團隊現在正在小鼠和豬身上嘗試這種方法。他們計劃在一個單一平臺上整合共聚焦和 X 射線影像,科學家可以從中下載資料。“藉助同步加速器 X 射線成像,以單神經元解析度繪製人類連線組圖譜現在更加現實,”蔣安世說。將圖譜與其他資料融合有多容易還有待觀察。
本文經許可轉載,並於2017 年 1 月 25 日首次發表。