一項新的研究表明,計算機演算法在重建已滅絕的“原始語言”的發音方面,幾乎與訓練有素的語言學家一樣出色。
不列顛哥倫比亞大學統計學系助理教授、描述該演算法的論文的主要作者亞歷克斯·布沙爾-科特說:“我們的[計算機]系統目前正在做一項基本的工作。” 但這位統計學家補充說,該程式的工作效果足夠好,它可能能夠讓語言學家有一個良好的開端。
幾個世紀以來,學者們一直在手工重建語言:檢視兩種或多種語言中的同一個詞,並對該詞的“祖先”的發音做出有根據的猜測。例如,西班牙語中“男人”(“hombre”)一詞和法語中“男人”(“homme”)一詞都源於拉丁語“homo”。語言學家比較後代語言中的詞來重建母語的方式,恰如其分地稱為比較法。
關於支援科學新聞
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您將有助於確保關於塑造我們當今世界的發現和想法的具有影響力的故事的未來。
19世紀早期的語言學家弗朗茨·博普是第一個使用這種方法比較希臘語、拉丁語和梵語的人。格林兄弟的雅各布·格林使用了比較法來展示日耳曼語系如何從一個共同的祖先發展而來。
這位統計學家說,他和布沙爾-科特的程式的區別在於,“我們是在更大規模上做的。”
作為概念驗證,布沙爾-科特將來自 637 種南島語系(在印度尼西亞、馬達加斯加、菲律賓、巴布亞紐幾內亞、馬來西亞等地使用)的詞語輸入到新的演算法中,該系統得出了一份所有這些語言的祖先詞語的發音列表。在超過 85% 的情況下,自動重建結果與語言學家普遍接受為正確的祖先詞語僅相差一個字元。
該演算法不會取代訓練有素的人類語言學家,但可以加快語言分析的速度。
布沙爾-科特說,使用計算機進行大規模重建還具有另一個優勢:有了大資料集,“你可以真正開始發現規律……你可能會發現某些聲音比其他聲音更容易發生變化。”
因此,布沙爾-科特的團隊測試了“功能負載假說”,該假說認為,對於區分兩個詞更重要的聲音,隨著時間的推移不太可能發生變化。 1967 年對該假設進行的正式測試研究了四種語言;布沙爾-科特的演算法研究了 637 種。
布沙爾-科特和他的合著者在新研究中寫道:“如果我們無法重建大量的原始語言,那麼揭示的模式將不明顯。”
除了幫助語言學家瞭解過去人們的說話方式外,研究古代語言也許可以回答歷史問題。
例如,布沙爾-科特說,“假設人們有興趣找出歐洲是什麼時候被定居的。如果你能弄清楚定居人口的語言是否有一個表示輪子的詞,那麼你就可以瞭解事物發生的順序,因為你會有一些記錄顯示輪子是什麼時候發明的。”
版權所有 2013 TechNewsDaily,TechMediaNetwork 公司。保留所有權利。未經許可,不得釋出、廣播、改寫或重新分發此材料。