多麗絲·曹的職業生涯始於解讀面孔——但在九月的幾個星期裡,她努力控制自己臉上的表情。曹剛剛獲得了麥克阿瑟基金會“天才”獎,這項榮譽附帶超過五十萬美元的獎金,獲獎者可以隨意使用。但她發誓要保密——即使基金會派了一個攝製組到她在帕薩迪納加州理工學院(加州理工學院)的實驗室。她既興奮又尷尬,不得不編造一個解釋,同時還要控制住自己的表情。
正是她在面孔研究方面的工作為曹贏得了獎項和讚譽。去年,她破解了大腦用來識別面孔的程式碼,這些面孔來自形狀、特徵之間的距離、色調和紋理等無數微小的差異。編碼的簡潔性讓神經科學界感到驚訝和印象深刻。
倫敦大學學院的塞恩斯伯裡惠康神經迴路與行為中心主任湯姆·姆爾西奇-弗洛格爾說:“她的工作具有變革意義。”
關於支援科學新聞報道
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您將幫助確保有關塑造我們當今世界的發現和思想的具有影響力的故事能夠擁有未來。
但曹不想僅僅被人們記住是發現面孔程式碼的科學家。她說,這只是一種手段,是解決她真正感興趣的問題的好工具:大腦如何透過填補感知中的空白來構建一個完整、連貫的世界模型?她說:“這個想法有一個優雅的數學公式”,但一直很難付諸實踐。曹現在有了一個如何開始的想法。
對於神經科學家瑪格麗特·利文斯通來說,曹有雄心壯志解開一些最棘手的思維奧秘並不奇怪,利文斯通在曹於馬薩諸塞州波士頓的哈佛醫學院攻讀博士學位期間一直指導她。“多麗絲從不跑題,”她回憶說。“她安靜而專注,總是追求大問題。”
曹在一個充滿科學的家庭中長大。她的母親是一名計算機程式設計師,她的父親是一名機器視覺研究員。當曹只有四歲時,他們從中國常州移民到美國,“為了過上更好的生活,擁有更多機會”,她說。
曹說:“我父親可能是我研究視覺的關鍵原因,儘管我試圖否認這一點。”早在她上高中的時候,他們就討論了大腦如何處理視覺方面的數學理論。她說,她發現這些理論“非常優美”。“他幫助在我腦海中種下了視覺需要深刻解釋的想法。”
她在加州理工學院畢業,獲得了數學和生物學學位,然後在 1996 年加入了利文斯通的團隊,最初研究大腦感知視覺深度的方式。
面孔程式碼
利文斯通的實驗室與獼猴合作,獼猴具有與人類相似的視覺系統和大腦組織。任何靈長類動物眼睛看到的世界景象都會從視網膜匯入視覺皮層,視覺皮層的各個層會對傳入的資訊進行初步處理。起初,它只不過是深色或淺色畫素,但在 100 毫秒內,資訊會迅速穿過大腦區域網路進行進一步處理,從而生成一個有意識地識別的 3D 景觀,其中有許多物體在其中移動。
在攻讀博士學位的大部分時間裡,曹都專注於視覺皮層的最外層,視網膜的資訊首先到達那裡。她學會了如何將微小的電極——靈敏到足以記錄單個腦細胞的放電——插入猴子大腦的這個區域。但為了幫助她更深入地探究視覺皮層,她決定將腦成像新增到她的研究方法中。功能性磁共振成像 (fMRI) 提供的更廣泛的大腦啟用圖譜可以幫助指導更精確的單細胞記錄技術。當時,很少有實驗室對動物的大腦進行成像,但比利時魯汶天主教大學的猴子 fMRI 先驅維姆·範杜菲爾幫助曹建立了在波士頓開展這項工作所需的基礎設施。
在學習這項技術的過程中,她注意到附近麻省理工學院的神經科學家南希·坎維什做出了一項令人驚訝的 fMRI 發現。坎維什已經確定了人類大腦中的一個小區域,當一個人看到面孔圖片時,該區域會亮起,但當他們看到房屋或勺子等其他物體的圖片時,該區域不會亮起。
曹推斷,如果猴子身上也存在相同的面部識別系統,她就可以使用她靈敏的電極來探測涉及的神經元,並弄清它們是如何運作的。
她與當時在坎維什實驗室擔任博士後的溫裡奇·弗賴瓦爾德合作,開始了一系列實驗,將 fMRI 與單細胞記錄技術相結合,以探測下顳 (IT) 皮層,即坎維什已確定的腦區。在接下來的八年左右的時間裡,弗賴瓦爾德、曹及其合作者取得了一系列重要發現。在獼猴面前一張接一張地展示圖片,他們繪製出了對人類或猴子面孔做出反應的單個細胞。這使他們能夠識別出大腦每側的六個斑塊,這些斑塊沿著 IT 皮層分佈。如果研究人員對任何一個斑塊進行電刺激,其他斑塊也會亮起。弗賴瓦爾德說,第一次看到這些面部斑塊在一個網路中協同工作“是一個快樂的時刻”,他現在在紐約市的洛克菲勒大學工作。
弗賴瓦爾德和曹還發現,這些斑塊往往是專門化的。透過向猴子展示一系列卡通面孔,這些面孔缺少頭髮、鼻子或虹膜等各種細節,他們可以確定哪些細胞對特定的面部特徵做出反應。細胞的放電率會根據特徵的極端程度而上升,這種特性被稱為斜坡形調諧,事實證明,斜坡形調諧是面部編碼的基礎。例如,一個對兩眼之間距離做出反應的細胞,可能對近距離的眼睛放電緩慢,但對距離較遠的眼睛放電迅速。當他們向猴子展示看向不同方向的真實面孔時,研究人員發現,最靠近視覺皮層的斑塊中的細胞傾向於對任何面孔的特定方向做出反應,而最深處的斑塊中的細胞則對少數幾個特定的面孔做出反應,無論其方向如何。
為了研究 IT 皮層如何從這些資訊中編碼完整的面孔,曹意識到,每個面孔都可以透過混合“面孔性”的最重要維度來建立,例如鼻子有多尖、眼睛的間距或膚色。她和她的博士後史蒂文·李·張確定了面孔之間變化最大的 50 個維度——形狀 25 個,外觀 25 個——並建立了一組 2,000 張面孔影像,其中所有 50 個維度的值都是已知的。當他們測量兩個面部斑塊中 205 個神經元的反應時,他們向猴子閃爍這些影像。程式碼開始顯現出來。
更表層的斑塊中的細胞傾向於針對形狀維度進行調諧,而位於 IT 皮層更深處的許多細胞則對外觀維度做出反應。這是有道理的,因為當頭部轉動時,更深層的細胞可能必須考慮扭曲的形狀維度。曹和張可以根據任何面孔的維度來預測神經元將如何放電,他們甚至可以僅從這些細胞的放電模式中重建面孔(參見“解碼面孔”)。
這項研究似乎指向了一種機制,透過這種機制,皮層中的單個細胞解釋越來越複雜的視覺資訊,直到在最深處,單個細胞編碼特定的人。
這個想法在直覺上很有道理。2005 年,當時在加州理工學院擔任博士後的羅德里戈·奎安·基羅加發現了後來被稱為詹妮弗·安妮斯頓細胞的東西。透過與大腦中植入了電極以治療癲癇發作的人合作,奎安·基羅加發現了來自單個神經元的訊號,這些神經元對熟悉或著名人物的照片做出反應。這些細胞也對那個人的任何概念做出反應。例如,一個神經元對演員詹妮弗·安妮斯頓的照片做出反應,但也對她的書面名字甚至她主演的電影的標題做出反應。這些“概念”細胞位於海馬體中,海馬體比 IT 皮層更深一點。
2015 年,曹在瑞士阿斯科納的一個小型會議上遇到了現在在英國萊斯特大學工作的奎安·基羅加,她在會上展示了她的最新成果。晚飯後,他問她,她認為她的面部細胞與他的概念細胞有何關係。“它們可能是它們的前身,”她告訴他。但她整晚都在為自己的回答而煩惱。有一件事一直困擾著她。她一直在研究的深層 IT 皮層細胞經常對幾個不同的面孔做出反應——那些看起來根本不像的面孔。
那天晚上無法入睡,她仔細思考了她和張一直在應用到他們資料中的數學分析。然後,頓悟的時刻來臨了。她已經無數次地研究過如此簡潔地描述細胞斜坡形調諧反應的數學。但在黑暗、寂靜的酒店房間裡,她意識到這與描述一種投影的數學運算相同。例如,投影解釋了太陽如何根據兩個不同物體的位置投射相同的陰影。她說,如果細胞只是從多維“面孔空間”中投影組合維度,“這將解釋為什麼許多不同的面孔可以在一個面部細胞中引起相同的反應”。IT 皮層根本不是在追蹤某一個特定的人;這種轉變一定發生在大腦中更深處。
一個分類變化
早餐時,她告訴奎安·基羅加她新的預感,發現他也在考慮同樣的事情。因此,她打了一個不同尋常的賭:她和他打賭一瓶昂貴的葡萄酒,賭它是錯的,“因為如果它是真的,即使沒有葡萄酒我也會很高興”。
她和張匆匆趕回實驗室,開始了額外的實驗,結果她輸掉了這瓶酒,但也最終在 2017 年發表了面部識別程式碼。
曹說,這個程式碼令人興奮地——也許只是一點點令人失望地——簡單。她說,這個認識“是我最快樂的時刻之一”。
很有可能相同的簡單程式碼可能適用於整個 IT 皮層。科學家們發現了其他類似於面部斑塊網路的網路,這些網路對其他事物做出反應,包括身體、場景和彩色物體。但 IT 皮層的大部分割槽域仍是未知的領域。在今年夏天在柏林舉行的一次神經科學會議上,曹介紹了她目前工作的一些細節。她和她的博士後包平磊一起,對她稱之為 IT 皮層無人區的細胞進行了電刺激,同時掃描了猴子的大腦。兩個斑塊亮了起來,表明存在另一個網路——但這一次她不知道它的功能。
為了弄清楚,她用她的記錄電極瞄準了這些斑塊,並監測了神經元活動,當時一隻猴子觀看了 50 個隨機選擇的物體的圖片——從動物和車輛到蔬菜和房屋——每個物體來自 24 個不同的角度。神經元不對面孔做出反應,但放電活動的模式也沒有表明任何其他特定類別的物體與該網路有關。相反,神經元似乎編碼了不同物體的通用屬性。例如,它們似乎記錄了某物是像相機三腳架那樣尖銳,還是像 USB 棒那樣粗短;像貓一樣有生命,還是像房子一樣無生命。
這個網路處理資訊的方式與面部斑塊網路處理面孔的方式有著驚人的相似之處。單個細胞對形狀或特徵元素做出反應,並具有斜坡形調諧。例如,一個針對物體的生命力進行調諧的細胞,可能對洗衣機放電緩慢,而對貓放電迅速。更表層的斑塊中的細胞傾向於對相似方向的相似類別的物體做出反應,而 IT 皮層最深處的斑塊中的細胞傾向於對少數幾個特定物體做出反應,無論角度如何。曹和包能夠透過檢視僅約 400 個左右神經元的放電模式來正確預測任何物體的外觀。
曹說:“我們認為整個 IT 皮層可能都使用相同的組織結構,即連線斑塊的網路,以及用於所有型別物體識別的相同程式碼。”
瑞士巴塞爾弗里德里希·米歇爾生物醫學研究所的神經科學家格奧爾格·凱勒對此表示贊同。“這讓人有希望,這種基於特徵的編碼可能在大腦中廣泛運作,”他說。
產生幻覺的引擎
然而,現在,曹想解決更大的問題,即大腦如何捕捉世界的整體,而不僅僅是如何解碼物體。這意味著不僅要理解流入大腦的視覺和其他感官資訊是如何處理的,還要理解經驗在大腦深處嵌入的高階知識是如何影響感知的。“想想我們如何知道湖面上一個模糊的斑點很可能是一隻鴨子,”她說。
她說,大腦不僅僅是一系列被動地篩選出面孔、食物或鴨子的篩子,“而是一個產生幻覺的引擎,它基於當前對世界的最佳內部模型來生成一個現實版本”。她的想法借鑑了貝葉斯推理理論;她說,只有將感知與高階知識相結合,大腦才能對現實達成最佳理解。
一種可能的機制是一種長期爭論的理論,稱為預測處理,該理論目前正在神經科學家中引起興趣。預測處理認為,大腦的運作方式是預測其周圍環境將如何逐毫秒地變化,並將該預測與透過各種感官接收到的資訊進行比較。它使用任何不匹配——“預測誤差”——來更新其世界模型。
為了弄清楚發生了什麼,曹想了解大腦產生幻覺的引擎是如何連線的。但由於不確定哪種方法最有效,她正在同時嘗試幾種方法,並從大腦更深層的部分進行記錄。
她的方法之一包括探測視錯覺,例如著名的面孔-花瓶圖片。大腦在盯著它看幾秒鐘後會自動在兩種感知之間切換。透過在猴子盯著圖片看時記錄單個神經元,曹試圖確定切換髮生在大腦中的哪個位置以及如何發生,以及它如何重置世界的內部表徵。另一種方法包括向猴子展示一張熟悉的面孔的圖片,然後將其變形為另一張熟悉的面孔,同時在大腦中進行記錄。靈長類動物的大腦會自動嘗試將面孔歸類為熟悉的,並在一個精確的點切換其對它所看到的兩個個體中哪一個的感知。“十年前,沒有人會知道從哪裡開始研究這些現象,因為我們不知道面孔——或花瓶——在大腦中的哪個位置被處理,”曹說。現在,位置和程式碼都已知,“我們可以詢問關於感知發生變化時究竟發生了什麼變化的問題”。
研究小鼠視覺皮層預測編碼的凱勒說,在非人靈長類動物中使用這種方法“具有很大的潛力”。他說,小鼠對世界的內部模型有限,而且從小鼠身上獲得的結果是否適用於人類尚不清楚。儘管他和其他人可以使用 fMRI 和腦電圖來研究人類大腦中的預測編碼,但這些技術只允許進行膚淺的檢查。“我們無法像多麗絲那樣深入瞭解人類的機制或它是如何實現的。”
曹繼續深入大腦進行探索,以尋找她父親在她年輕時啟發她的那種優美的方程式。然而,她不再需要隱藏她的興奮。現在,這種興奮洋溢在她整個臉上。
