這是我們關於自我實驗者的網路專題報道的八篇文章中的第五篇。
當德布·羅伊和他的妻子有可能會遇到他們兩歲半兒子的過夜客人時(為了保護孩子的隱私,他們沒有透露孩子的名字)—他們做的第一件事就是要求訪客填寫一份同意書。當然,這很不尋常,但這對夫婦只是想讓人們意識到他們的行為和聲音可能會被安裝在他們位於馬薩諸塞州劍橋市的家中,並隱藏起來的11個魚眼攝像頭和14個麥克風捕捉到。 這些裝置幾乎監聽著他們兒子發出的每一個聲音。
這種設定的兩個主要目標是:瞭解兒童如何習得語言,並將收集到的智慧用於教機器人說話。
39歲的羅伊是麻省理工學院媒體實驗室認知機器組的負責人,他正在記錄他稱之為“人類語音組專案”中每次的親子“對話”。他估計,到今年晚些時候完成該專案的錄音階段時,他將收集到估計20萬小時的影片和多軌音訊資料——約佔孩子生命最初兩年的70%清醒時間,以及第三年的一部分。
羅伊在對一個名為託科的特定機器人的機器人研究陷入僵局後啟動了這個專案。作為麻省理工學院媒體實驗室的研究生,他想教機器人說話,因此他為託科程式設計了精密的影像和語音處理軟體,並結合了他希望奏效的機器學習演算法。但是,當羅伊將一個球放在託科的攝像頭前時,他意識到機器無法理解“球”(物體)和“圓形”(物體的屬性)含義之間的區別,這兩者在其計算機記憶體中都以相同的方式表示。
他認為,克服這個問題的首要步驟是弄清楚幼兒如何學習解決同樣的問題。
支援科學新聞報道
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。 透過購買訂閱,您正在幫助確保未來能夠繼續產出關於塑造我們當今世界的發現和想法的有影響力的報道。
研究人員之前曾嘗試解開語言習得的過程,通常是在實驗室或家庭環境中,對母親和她們的孩子進行幾個小時的竊聽。但是,從如此有限的觀察中很難得出任何確鑿的結論。“在發展心理學中,長期以來一直存在一種權衡,即從少數兒童那裡收集大量資料,或者從大量兒童那裡收集少量資料,”哈佛大學語言學家史蒂芬·平克說道,他幾年前也提出了類似的想法。在像羅伊這樣的案例中,“當擴充套件到更大的樣本時,只要關注正常兒童不太可能表現出巨大個體差異的基本問題,這些發現就能很好地成立。”
羅伊是一位受過訓練的工程師,他計劃將他龐大的資料集進行嚴格的分析,以試圖找出他、他的妻子(魯帕爾·帕特爾,波士頓東北大學的言語語言病理學教授)和孩子在教授和學習共同概念時的說話方式的模式。(他指出,當你的父母都是教授時,“你可能不得不聽很多談話。”)他希望透過研究某些線索來重建使兒童逐漸將意義附加到單詞和表達的心理過程:說了什麼詞(例如,“食物?”);誰說的(帕特爾);說話者當時想要什麼(讓孩子坐到高腳椅上);以及孩子的反應(“不”)。
羅伊不習慣24/7地觀察他人,他選擇將專案限制在家庭內部(並徵得帕特爾的同意)。 並非他們的生活完全透明。“糟糕按鈕”允許這對夫婦刪除他們寧願不記錄的事情。 作為進一步的保障,音訊記錄被分解並以隨機片段的形式傳送給一群轉錄員,這限制了他們重建這對夫婦家中事件的能力。
對這座嬰兒語“高塔”的分析才剛剛開始,但羅伊已經開始意識到將該專案擴充套件到其他志願者需要做些什麼——例如,幫助有溝通問題的孩子的家庭。“如果我們想擴大研究範圍或幫助其他人進行類似的研究,”他說,“我們知道哪些倫理問題是重要的。”