3D列印裝置幫助計算機解決雞尾酒會難題

聲學超材料可以根據聲音的方向對其進行分類

加入我們的科學愛好者社群!

長期以來,人工智慧研究人員一直努力使計算機執行一項對人類來說很簡單的任務:當附近有多人同時說話時,挑出其中一個人的語音。

這被稱為“雞尾酒會難題”。解決該問題的典型方法包括使用帶有多個麥克風的系統,這些系統根據說話者在房間中的位置來區分說話者,或者使用複雜的、嘗試在錄音中分離不同聲音的人工智慧演算法。

但是,本週《美國國家科學院院刊》中描述的最新發明是一種簡單的3D列印裝置,它可以精確定位聲音的來源,而無需任何複雜的電子裝置。


關於支援科學新聞

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保未來能夠繼續講述關於塑造我們當今世界的發現和思想的有影響力的故事。


該裝置是一個厚厚的 塑膠圓盤,大約有一個披薩那麼寬。邊緣周圍的開口透過 36 個通道將聲音引導到中間的麥克風。杜克大學(位於北卡羅來納州達勒姆)的電氣工程師、資深作者 Steven Cummer 解釋說,每個通道在聲音向中心傳播時,都會以略微不同的方式修改聲音——大致就像一個具有不同設定的均衡器影響每個切片中的聲音一樣。

水瓶旋律
他說,圓盤的工作方式很簡單。如果你對著部分裝滿水的瓶子頂部說話,瓶子內部的空氣會與聲音產生共鳴並衰減某些頻率,具體取決於瓶子裡的水量。在塑膠圓盤中,每個扇區的內部都佈滿了蜂窩狀結構,其中每個六邊形單元都被切割成不同的高度。Cummer 說,結果就像擁有一系列裝有不同水量瓶子的陣列。

杜克大學的首席作者 Yangbo Xie 說,人耳無法區分聲音是如何被不同通道改變的。但是,該團隊編寫了一種演算法,透過分析每個聲音,幾乎總是可以分辨出聲音來自哪個方向。

該裝置是一種“聲學超材料”:一種佈滿了較小特徵並旨在影響透過它的聲波的結構。英國布里斯托大學的機械工程師 Bruce Drinkwater 稱這個想法“真的很棒”。他說,該裝置的體積可能限制了它的實際應用,並且該版本僅在相對較高的頻率下工作。但是,他補充說,“未來在尺寸方面可能還有很大的最佳化空間。”

本文經許可轉載,並於2015年8月10日首次發表

Davide Castelvecchi is a staff reporter at Nature who has been obsessed with quantum spin for essentially his entire life. Follow him on Twitter @dcastelvecchi

More by Davide Castelvecchi

First published in 1869, Nature is the world's leading multidisciplinary science journal. Nature publishes the finest peer-reviewed research that drives ground-breaking discovery, and is read by thought-leaders and decision-makers around the world.

More by Nature magazine
© .