你的大腦如何區分語音和音樂

簡單的線索幫助人們區分歌曲和口語

Illustration of ear with sound waves on blue background

Peterschreiber.media/Getty Images

人們通常不會混淆歌唱和說話的聲音。這似乎是顯而易見的,但實際上非常令人印象深刻——尤其因為即使我們遇到從未聽過的語言或音樂型別,通常也能區分兩者。人類大腦究竟是如何毫不費力且瞬間做出這種判斷的?

科學家們對語音如何轉化為句子以及音樂聲音如何觸動我們的情感,已經有了相對豐富的理解。當聲波撞擊我們的耳朵時,它們會啟用內耳耳蝸內的聽覺神經。反過來,聽覺神經會將訊號傳輸到大腦。這些訊號沿著所謂的聽覺通路傳播,首先到達處理各種聲音的子區域,然後到達專門的音樂或語言子區域。根據訊號最終到達的位置,人會將聲音理解為特定型別的有意義的資訊——並且可以區分詠歎調和口語句子。

這就是聲音處理的概括性描述。但是,我們的感知系統如何在聽覺通路中區分這些聲音,仍然令人驚訝地不清楚。當然,有一些線索:音樂和語音波形具有不同的音高(聽起來高或低的音調)、音色(聲音的質量)、音素(語音聲音單位)和旋律。但是,大腦的聽覺通路並非一次處理所有這些元素。考慮一下從紐約市寄信到臺北的類比。信件的內容詳細解釋了其目的,但信封仍然必須標明其目的地。同樣,即使語音和音樂都包含大量資訊,我們的大腦也需要一些基本的線索來快速確定要調動哪些區域。


支援科學新聞事業

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞事業 訂閱。透過購買訂閱,您正在幫助確保有關塑造我們當今世界的發現和想法的具有影響力的故事的未來。


神經科學家的問題是,大腦如何決定將傳入的聲音傳送到語言區域還是音樂區域進行詳細處理。我在紐約大學、香港中文大學和墨西哥國立自治大學的同事和我決定研究這個謎團。在我們去年春天發表的一項研究中,我們提出的證據表明,聲音的一個簡單屬性,即幅度調製——它描述了一系列聲音的音量或“幅度”隨時間變化的快慢——是大腦快速聲學判斷的關鍵線索。我們的發現暗示了音樂和語音對人類物種的不同進化作用。

過去的研究表明,語音的幅度調製率在不同語言中高度一致,測量結果為每秒四到五個赫茲,這意味著聲波每秒有四到五個起伏。同時,音樂的幅度調製率在不同型別音樂中是一致的,約為一到兩個赫茲。換句話說:當我們說話時,在給定的時間跨度內,我們聲音的音量變化比唱歌時快得多。

鑑於這種模式的跨文化一致性,我們想知道幅度調製是否可能反映了一種普遍的生物學特徵,這種特徵在人腦區分語音和音樂方面起著關鍵作用。我們製作了特殊的白噪聲音訊片段,在其中調整了音量和聲音隨時間變化的快慢。我們還調整了這種變化的規律性——也就是說,音訊是否具有可靠的節奏。我們使用這些白噪聲片段而不是真實的音訊錄音,以便更好地控制幅度調製的效果,而不是聲音的其他方面,例如音高或音色。

在針對 300 多名參與者的四項實驗中,我們要求人們收聽這些音訊檔案,並告訴我們它們聽起來更像語音還是音樂。結果揭示了一個非常簡單的原則:幅度調製率較慢且節奏更規則的音訊片段更有可能被判斷為音樂,而相反的模式適用於語音。這表明我們的大腦將較慢、較規則的幅度變化與音樂聯絡起來,而將較快、不規則的變化與語音聯絡起來。

這些發現激發了關於人類思維的更深層次的問題。首先,為什麼語音和音樂的幅度隨時間變化如此不同?進化假設提供了一些可能的答案。人類使用語音進行交流。當我們說話時,我們會調動聲道的肌肉,包括下巴、舌頭和嘴唇。移動這些肌肉進行說話的舒適速度約為每秒四到五個赫茲。有趣的是,我們對這種速度的聲音的聽覺感知得到了增強。速度、產生和感知上的這種一致性可能並非巧合。一種可能的解釋是,人類以這種神經生理學最佳化的快速速度說話,以確保有效的資訊交換——而這種快速說話可以解釋語音中幅度調製率高於音樂。

另一方面,關於音樂進化起源的一種假設是,它透過協調多個人的活動和運動,有效地在社會內部建立社會聯絡,例如透過親子互動、集體舞蹈和勞動號子。研究表明,當人們同步運動時,他們會更緊密地聯絡在一起。因此,音樂要發揮其進化功能,可能需要以允許舒適的人類運動的速度進行,大約為每秒一到兩個赫茲或更低。此外,可預測的節拍使音樂更適合集體跳舞。

還有許多問題需要探索。還需要進行更多研究,以瞭解大腦是否從出生起就能夠根據聲學調製來區分音樂和語音,或者是否依賴於學習到的模式。理解這種機制可能有助於患有失語症(一種影響語言交流的疾病)的患者,透過速度和規律性經過仔細調整的音樂來理解語言。我們的進化概念也值得進一步研究。關於音樂和語音的進化起源存在各種假設,這些假設可能會激發其他研究。更多的跨文化研究可以確保這些想法在所有社群中真正成立。

至於大腦如何在聽覺通路中區分音樂和語音,我們懷疑還有更多內容有待發現。幅度調製很可能只是一個因素——或許只是定址信封上的一行字——可以幫助解釋我們大腦驚人的辨別能力。

您是專門研究神經科學、認知科學或心理學的科學家嗎?您是否讀過最近發表的同行評審論文,並想為“心靈 Matters”撰寫文章?請將建議傳送給《大眾科學》的“心靈 Matters”編輯 Daisy Yuhas,郵箱為dyuhas@sciam.com

這是一篇觀點和分析文章,作者或作者表達的觀點不一定代表《大眾科學》的觀點。

Andrew Chang 是紐約大學的博士後研究員,他的工作得到了美國國立衛生研究院 Ruth L. Kirschstein 博士後個人國家研究服務獎和 Leon Levy 神經科學獎學金的支援。他研究聽覺感知的神經機制以及人們在現實世界中使用音樂和語音進行互動的方式。

更多作者文章:Andrew Chang
大眾科學 Magazine Vol 332 Issue 1本文最初以 “你的大腦區分語音和音樂” 為標題發表於 《大眾科學》雜誌 第 332 卷第 1 期(),第 79 頁
doi:10.1038/scientificamerican012025-6UBWwE1Ha8NBo3eVfDQx7B
© .