前瞻性研究:教導計算機像人類一樣看世界

麻省理工學院的研究人員正在利用人類視覺的計算機模型來改進影像識別軟體

加入我們的科學愛好者社群!

儘管計算機已經非常精密,但它們仍然無法與大自然的恩賜——大腦相媲美。大腦能夠快速而準確地對物體進行分類,從而使人類和靈長類動物能夠即時解讀他們所看到的東西。儘管經過了幾十年的發展,計算機視覺系統仍然會被大量必要的資料所困擾,而這些資料僅僅是為了識別最基本的影像。如果將同一張影像置於不同的環境中,或者改變光照條件,那麼人工智慧就更無法與優秀的灰質相提並論了。

隨著對安全系統的需求增長,這些缺點變得更加緊迫。這些安全系統需要在擁擠的機場中識別已知的恐怖分子面孔,以及汽車安全機制,例如當感測器檢測到行人或另一輛車在汽車行駛路徑上時可以踩剎車的感測器。為了尋求前進的方向,麻省理工學院的研究人員正在研究神經科學的進展,以尋求改進人工智慧的方法,反之亦然。該校在神經科學和計算機科學領域的頂尖人才正在彙集他們的研究成果,將複雜的大腦計算模型與他們在影像處理方面的工作相結合。

這種跨學科的方法在一年前開始取得成果,當時由麻省理工學院麥戈文腦研究所的研究員、該校腦與認知科學系的教授托馬索·波吉奧領導的一組研究人員,使用了一種受大腦啟發的計算機模型來解讀一系列照片。雖然這種神經模型最初是作為大腦中某些視覺通路如何工作的理論分析而開發的,但事實證明,在快速識別一些複雜場景方面,它與現有的最佳計算機視覺系統一樣好,甚至更好。此前,當一臺計算機被展示馬的圖片,以及站在森林中的其他動物,並被要求每次識別馬時,它會被所有可能將馬與其他動物或樹木區分開來的資料所淹沒。


關於支援科學新聞

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞事業 訂閱。透過購買訂閱,您正在幫助確保有關塑造我們當今世界的發現和想法的具有影響力的故事的未來。


波吉奧說,當使用神經模型時,這是計算機模型首次能夠在這種任務上重現人類行為,這使研究人員更接近於理解視覺皮層如何識別物體和場景。

波吉奧說,多年來,一些汽車公司一直試圖開發計算機系統,使其車輛能夠在擁擠的背景中識別行人和其它車輛,並在駕駛員過於靠近時向其發出警告。波吉奧說,這種型別的識別對人類來說非常容易,但是“當我們這樣做時,我們並沒有意識到我們的大腦中發生了什麼。”

當一個人看到一張圖片時,即使只是一瞬間,大腦的視覺皮層也會立即識別出它所看到的東西。視覺皮層是大腦處理系統的重要組成部分,也是最複雜的部分之一。波吉奧說,理解它的工作原理可能是瞭解整個大腦如何運作的重要一步。他說:“視覺只是智慧的代表。” 人類的大腦更清楚它是如何解決複雜問題的,例如下棋或解代數方程,這就是為什麼計算機程式設計師在構建模擬這類活動的機器方面取得了如此大的成功。

到目前為止,波吉奧的研究已經模擬了“前饋”視覺,即當影像首次呈現給眼睛時發生的視覺。他和他的同事現在正在研究開發新的模型,以幫助他們更好地理解一旦眼睛開始掃描影像中描繪的場景並解釋場景中物體之間的空間關係時,大腦是如何工作的。希望這最終將導致計算機軟體能夠做同樣的事情,並最終不僅解釋人類的快速認知,還能解釋我們視覺智慧的其他方面。請密切關注。

© .