一份新的報告指出,一種新的計算機模型已經學會識別來自多位英語和日語使用者的母音類別,而無需“知道”它正在尋找的母音數量,也無需擁有要分析的完整聲音列表。相反,它透過一次考慮一個母音,逐漸將母音歸為不同的組,這讓人想起嬰兒可能如何注意聲音。
該模型的設計者表示,這是改進語音識別軟體以及更好地理解嬰兒大腦如何識別其檢測到的聲音是在說一種語言而不是另一種語言的早期步驟。
斯坦福大學心理學教授、《美國國家科學院院刊》線上報告的合著者詹姆斯·麥克萊蘭德說:“我們認為這項工作代表著一種趨勢,即認為語言學習是一個依賴經驗的過程。”
支援科學新聞報道
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保未來能夠繼續報道關於塑造我們當今世界的發現和想法的具有影響力的故事。
不列顛哥倫比亞大學(溫哥華)的心理學家珍妮特·沃克在實驗室中錄製了母親們用英語或日語對嬰兒說無意義的聲音 [點選此處獲取聲音樣本]。這兩種語言都有五個母音,粗略地說,它們有長短兩種形式,例如英語中的“bait”和“bet”,它們的頻率不同,而日語母音的區別在於聲音的持續時間。
為了區分每種語言的“i”和“e”母音形式,麥克萊蘭德、沃克及其同事將每個錄製的母音轉換為三個數字,分別代表聲音的持續時間和兩個主要頻率。然後,他們一次一個母音地將這些值輸入到他們的模型中。
該程式將每個值放在可能定義口語母音的許多持續時間或頻率的連續統一體上。這些值加強了特定的持續時間或頻率,逐漸為每種母音形式構建了一個三維空間。
該小組報告稱,經過這樣的訓練,該程式在英語中正確分類了高達 93% 的母音,在日語中正確分類了 92% 的母音。
麥克萊蘭德說,以前的語言學習模型不太現實,因為它們反覆掃描大量聲音資料,而不是一次掃描一個聲音。
他補充說,採用類似的程式可能使語音識別軟體能夠適應同一種語言的不同使用者,從而提高其準確性。
他說,新的模型很難與嬰兒學習進行比較,因為研究人員不知道嬰兒聽到什麼聲音。 “但是,”他補充說,“它在它所做的事情上非常成功,並且它使用了一套我們認為是在正確軌道上的原則。”