計算機現在比人類更擅長識別模式

一種人工智慧方法,使計算機識別視覺模式的能力優於人類

加入我們的科學愛好者社群!

如果有人向您展示一個來自不熟悉字母表的字元,並要求您將其複製到一張紙上,您可能可以做到。但是,即使配備了最先進的深度學習演算法(例如谷歌用於分類照片的演算法),計算機也會束手無策。這些機器學習系統需要對大量資料集進行訓練,才能對影像進行最基本的區分。這對於郵局中按郵政編碼對信件進行分類的機器來說可能很好。但對於更微妙的問題,例如即時語言翻譯,從少量示例中學習的方法會更有效率。

由於一種名為貝葉斯程式學習(BPL)的機器學習框架,計算機正接近實現這一飛躍。紐約大學、麻省理工學院和多倫多大學的一個研究團隊表明,使用BPL的計算機在基於單個示例的暴露來識別和重新建立不熟悉的手寫字元集方面,可以比人類表現更好。(“貝葉斯”指的是一種機率推理,可以用來根據新的證據更新不確定的假設。)

BPL機器學習方法從根本上不同於深度學習,後者大致模擬了人腦的基本模式識別能力。相反,BPL從人腦推斷可能產生給定模式的一組動作的能力中獲得靈感。例如,它會識別出字母A可以由兩個在頂部連線的傾斜筆畫構成,中間有一個短的水平筆畫。“計算機透過組裝一個簡單的程式來表示A,該程式生成該字母的示例,每次執行程式碼時都會有不同的變體,”紐約大學的摩爾-斯隆資料科學研究員布倫丹·萊克說,他參與了這項研究。貝葉斯過程允許軟體應對從較小的、先前已知的部分(例如,A中的水平筆畫)重新建立不熟悉的字母的不確定性。


支援科學新聞

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保有關塑造我們當今世界的發現和想法的具有影響力的故事的未來。


這種機器學習更通用,也更高效。BPL軟體用於解構然後重新建立未知字母的相同過程,有朝一日可以為AI應用程式提供動力,這些應用程式可以推斷複雜現象(例如河流的流動)中的因果模式,然後使用它們來解決完全不同的系統。人類經常使用這種抽象的“橫向思維”;BPL可以為計算機解鎖類似的能力。“我們正在努力讓計算機能夠學習可以應用於許多不同任務或領域的概念,”萊克說。“這是人類智慧的核心方面。”

約翰·帕夫勒斯是一位專注於科學、技術和設計的作家和電影製作人。他的作品曾發表在《彭博商業週刊》、《麻省理工科技評論》和《美國最佳科學與自然寫作》系列中。他住在俄勒岡州波特蘭市。

更多作者:約翰·帕夫勒斯
大眾科學雜誌 第315卷 第6期本文最初以“8. 視覺閱讀軟體”為標題發表於《大眾科學》雜誌 第315卷 第6期(),第41頁
doi:10.1038/scientificamerican1216-39b
© .