你看到我所看到的嗎？從腦電波中翻譯影像

視覺解碼器允許研究人員將腦電波活動轉化為影像

關於支援科學新聞

如果您喜歡這篇文章，請考慮透過以下方式支援我們屢獲殊榮的新聞報道訂閱。透過購買訂閱，您正在幫助確保未來關於塑造我們當今世界的發現和想法的具有影響力的故事的未來。

將此歸類為未來主義的（也許有點嚇人）：為了有一天或許能破譯視覺和夢想，一項新的研究揭示了一種可以轉化人類大腦活動中的演算法。

來自加州大學伯克利分校的科學家今天在《自然》雜誌上報告說，他們開發了一種能夠解碼大腦視覺區域模式以確定某人所見的方法。不用說，這對社會的潛在影響是巨大的。

研究人員說：“這種通用的視覺解碼器將具有巨大的科學和實用價值。” “我們可以使用解碼器來研究不同人在感知上的差異，研究諸如注意力之類的隱蔽心理過程，甚至可能訪問純粹心理現象（如夢想和意象）的視覺內容。”

科學家說，先前嘗試從“大腦活動中提取心理內容”的嘗試只允許他們解碼有限數量的模式。研究人員會一次向個體提供影像（或要求他們考慮一個物體），然後尋找相應的腦活動模式。“你需要[事先]知道，對於你想讀取的每一個想法，什麼樣的活動模式與之相對應，”柏林伯恩斯坦計算神經科學中心和馬克斯·普朗克人類認知和腦科學研究所的教授約翰·迪倫·海恩斯說，他沒有參與這項新工作。

他繼續說道，“這裡提出的進步是，他們建立了一個數學模型，該模型捕獲了大腦視覺部分的屬性”，然後可以將其應用於先前未見過的物體。

研究人員使用功能性磁共振成像（fMRI）來記錄一對志願者（該研究的兩位合著者）在觀看一系列影像時視覺皮層的活動。他們透過將區域劃分為體素（體積單位或 3D 畫素）並注意每個部分響應的圖片部分來檢查大腦。例如，一個體素或切片可能以某種模式響應照片左上角的顏色，而另一個體素會被圖片的不同部分觸發。

海恩斯說，該團隊可以透過監測每個大腦區域的活動並破譯最可能在視覺視野或照片的相應部分中找到哪種資訊，來“回溯並推斷出一個人正在看到的影像”。

當志願者掃描一組新的 120 張影像時——描繪了從人到房屋到動物到水果和其他物體的所有事物——計算機程式正確識別他們所看到的內容，準確率高達 92%；當影像庫增加到 1,000 張時，該演算法的成功率為 80%。當然，隨著可能圖片數量的增加，其準確性會降低，但即使數量比 Google 在網際網路上索引的影像數量大 100 倍，據科學家稱，該模型的成功率也會超過 10%。（這遠遠超過了隨機猜測的成功率。）

研究人員寫道：“這表明fMRI 訊號包含大量的刺激資訊，並且這些資訊可以在實踐中成功解碼。”

海恩斯說，該方法僅限於破譯可以在空間中對映的資訊，例如感覺輸入（聲音來自何處）或運動功能（某人的手臂執行了什麼動作）。他說，挑戰在於，它不能“輕易地應用於沒有明確數學模型的情況”，例如記憶、意圖和情緒。“如果沒有這樣的數學模型，很難掌握高層次的想法，”他補充道。

所以，你現在可以把你的錫箔頭盔放在你的壁櫥裡了。這些演算法仍然無法讀取我們內心深處的想法——至少現在還不能。