使用人工智慧 (AI) 增強的腦機植入裝置,已使兩位癱瘓人士能夠以前所未有的準確性和速度進行交流。
在分別於8月23日發表在《自然》雜誌上的兩項研究中,兩個研究團隊描述了腦機介面 (BCI),這種介面可以將神經訊號轉化為文字或合成語音說出的單詞。BCI 可以分別以每分鐘 62 個單詞和每分鐘 78 個單詞的速度解碼語音。自然對話的速度約為每分鐘 160 個單詞,但這兩項新技術都比以往的任何嘗試都要快。
“現在可以想象,在未來,我們可以幫助癱瘓人士恢復流暢的對話,使他們能夠自由地說出他們想說的任何話,並且準確率足夠高,能夠被可靠地理解,” 斯坦福大學神經科學家弗朗西斯·威利特在 8 月 22 日的新聞釋出會上說,他是其中一篇論文的合著者。
關於支援科學新聞
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您將幫助確保未來繼續推出關於塑造我們當今世界的發現和思想的具有影響力的報道。
荷蘭馬斯特裡赫特大學的計算神經科學家克里斯蒂安·赫夫說,這些裝置“可能在不久的將來成為產品”。
電極和演算法
威利特和他的同事開發了一種 BCI,用於解釋細胞水平的神經活動並將其轉化為文字。他們與 67 歲的帕特·貝內特合作,她患有運動神經元疾病,也稱為肌萎縮側索硬化症——這是一種導致肌肉控制逐漸喪失的疾病,導致行動和說話困難。
首先,研究人員對貝內特進行了手術,將小型矽電極陣列插入大腦中參與言語的部分,位於表面下幾毫米處。然後,他們訓練深度學習演算法來識別貝內特試圖說話時大腦中的獨特訊號,使用了包含 125,000 個單詞的大詞彙集和包含 50 個單詞的小詞彙集。人工智慧從音素(構成口語單詞的語音亞單位)中解碼單詞。對於 50 個單詞的詞彙量,BCI 的工作速度比早期先進的 BCI 快 2.7 倍,單詞錯誤率達到 9.1%。對於 125,000 個單詞的詞彙量,錯誤率上升至 23.8%。威利特在新聞釋出會上說:“大約每四個單詞中就有三個被正確破譯。”
貝內特在給記者的宣告中說:“對於那些無法說話的人來說,這意味著他們可以與更大的世界保持聯絡,也許可以繼續工作,維持朋友和家庭關係。”
讀取大腦活動
在另一項研究中,加州大學舊金山分校的神經外科醫生愛德華·張和他的同事與一位名叫安的 47 歲女性合作,她在 18 年前腦幹中風後失去了說話能力。
他們使用了與威利特團隊不同的方法,將一個包含 253 個電極的紙薄矩形放置在大腦皮層的表面。這項技術稱為皮層腦電圖 (ECoG),被認為侵入性較小,可以同時記錄數千個神經元的綜合活動。該團隊訓練人工智慧演算法來識別安的大腦活動模式,這些模式與她嘗試使用 1,024 個單詞的詞彙量說出 249 個句子的嘗試有關。該裝置產生的速度為每分鐘 78 個單詞,單詞錯誤率中位數為 25.5%。
法國格勒諾布林神經科學研究所的神經技術研究員布萊斯·伊維特說,儘管威利特團隊使用的植入物能夠更精確地捕捉神經活動,並且在大詞彙量方面優於這項技術,但“很高興看到使用 ECoG 也能實現較低的單詞錯誤率”。
張和他的團隊還建立了定製演算法,將安的大腦訊號轉換為合成語音和一個模仿面部表情的動畫化身人物。他們透過使用安婚禮影片中的錄音訓練語音,使其聽起來像安受傷前的聲音。
安在研究後的反饋會議上告訴研究人員:“聽到與自己聲音相似的聲音,這種簡單的感覺就令人動容。” “當我能夠自己說話時,這種感覺太棒了!”
張說:“聲音是我們身份非常重要的一部分。它不僅關乎交流,還關乎我們是誰。”
臨床應用
在 BCI 可用於臨床使用之前,還需要進行許多改進。安告訴研究人員:“理想的情況是連線是無線的。” 伊維特補充說,適合日常使用的 BCI 必須是完全可植入的系統,沒有可見的聯結器或電纜。兩個團隊都希望繼續使用更強大的解碼演算法來提高其裝置的速度和準確性。
赫夫說,而且兩項研究的參與者在思考說話時仍然能夠調動面部肌肉,並且他們與言語相關的大腦區域完好無損。“但並非所有患者都是如此。”
威利特說:“我們認為這是一個概念驗證,只是為該領域的行業人士提供動力,將其轉化為人們真正可以使用的產品。”
這些裝置還必須在更多人身上進行測試,以證明其可靠性。加拿大溫哥華不列顛哥倫比亞大學的神經倫理學研究員朱迪·伊萊斯說:“無論這些資料多麼優雅和技術精湛,我們都必須以非常謹慎的方式在上下文中理解它們。” 她補充說:“我們必須小心,不要過度承諾在廣大人群中的廣泛適用性。” “我不確定我們是否已經達到那個程度。”
本文經許可轉載,並於2023年8月23日首次發表。
