2009年6月22日

谷歌開發地標識別引擎

本文發表於《大眾科學》的前部落格網路，反映了作者的觀點，不一定反映《大眾科學》的觀點

關於支援科學新聞業

如果您喜歡這篇文章，請考慮透過以下方式支援我們屢獲殊榮的新聞業訂閱。透過購買訂閱，您正在幫助確保未來能夠繼續講述關於塑造我們當今世界的發現和想法的具有影響力的故事。

雖然可以在網路上搜索影像，但仍然無法搜尋影像本身。谷歌希望透過一個研究專案來改變這一點，該專案可以將某些著名地標的數字照片與這些地標的文字描述（包括它們的名稱和位置）進行匹配，而無需傳統的搜尋引擎。

谷歌建立了其實驗性的地標識別引擎，方法是開發一個目標地標列表（例如埃菲爾鐵塔和雅典衛城），並找到這些位置的帶有GPS標籤的數字照片。然後，研究人員“教導”識別引擎透過聚類同一地標的不同影像（例如，在不同光照和不同角度下拍攝的影像）來識別特定地標。

以下是它在實踐中可能的工作方式：您正在瀏覽網路，偶然發現您不認識的地標影像。您複製影像位置，然後將該URL貼上到谷歌的地標識別引擎中。如果該影像與谷歌資料庫中的地標影像之一匹配，則識別引擎將返回一個結果頁面，其中包含該影像以及其名稱、位置，甚至可能還有描述。

谷歌計算機視覺研究主管傑伊·亞格尼克說，當系統被給予影像並要求描述它時，準確率達到80%。谷歌今天在邁阿密舉行的IEEE計算機學會計算機視覺與模式識別會議上展示這項研究，該研究是在新加坡國立大學研究人員的幫助下進行的。