科學家如何利用人工智慧與動物對話

行動式感測器和人工智慧正在幫助研究人員解碼動物交流——並開始與非人類對話

Portrait of Karen Bakker in nature

艾琳·里納爾迪

在 20 世紀 70 年代,一隻年輕的名為科科的大猩猩因其使用人類手語的能力而引起了全世界的關注。但懷疑論者認為,科科和其他“學會”說話的動物(包括黑猩猩和海豚)可能並不真正理解它們在“說”什麼——並且試圖讓其他物種使用人類語言,在人類語言中,符號代表可能不在物理上存在的事物,是徒勞的。

不列顛哥倫比亞大學教授、哈佛大學拉德克利夫高階研究院院士凱倫·巴克說:“有一組研究人員熱衷於找出動物是否可以進行符號交流,而另一組研究人員則說,‘那是擬人化。我們需要按照非人類交流本身的條件來理解它。’” 現在,科學家們正在使用改進的感測器和人工智慧技術來觀察和解碼各種物種,包括植物,如何使用它們自己的方法分享資訊。巴克 2022 年出版的著作《生命之聲:數字技術如何讓我們更接近動物和植物的世界》(普林斯頓大學出版社)的主題就是“數字生物聲學”領域。

《大眾科學》與巴克談論了技術如何幫助人類與生物交流,例如蝙蝠蜜蜂——以及這些對話如何迫使我們重新思考我們與其他物種的關係。


關於支援科學新聞報道

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保有關塑造我們當今世界的發現和想法的具有影響力的故事的未來。


[以下是採訪的編輯稿。]

您能簡要介紹一下人類嘗試與動物交流的歷史嗎?

在 20 世紀中期,人們曾多次嘗試將人類語言教給非人類,例如科科這樣的靈長類動物。這些努力有些爭議。當我們回顧過去時,我們現在有一種觀點(當時可能並不那麼流行),即我們在方法上過於以人類為中心。當時的願望是透過教非人類像我們一樣說話來評估非人類的智力——但事實上,我們應該思考它們以自己的方式、以自己的具體方式、以自己的世界觀進行復雜交流的能力。

本書中使用的術語之一是環境的概念,這是指生物體的生活體驗。如果我們關注另一個生物體的環境,我們就不會期望蜜蜂說人類語言,但我們會對蜜蜂迷人的語言非常感興趣,這種語言是振動和位置性的。它對我們甚至無法用我們的身體傳達的細微差別很敏感,例如陽光的偏振。這就是今天的科學發展方向。數字生物聲學領域——正在呈指數級加速發展,並揭示關於生命之樹中交流的有趣發現——現在正在接近這些動物,並詢問的不是“它們能像人類一樣說話嗎?”而是“它們能彼此交流複雜的資訊嗎?它們是如何做到的?什麼對它們來說是重要的?” 我會說這是一種更以生物為中心的方法,或者至少它不那麼以人類為中心。

從更宏大的角度來看,我認為承認傾聽自然,“深度傾聽”,具有悠久而值得尊敬的傳統也很重要。這是一種古老的藝術,至今仍以未被媒介化的形式實踐。長期以來,原住民就擁有深度傾聽的傳統,他們非常關注非人類的聲音。因此,如果我們將數字監聽——它正在開闢非人類聲音的廣闊新世界,並使用人工智慧解碼這些聲音——與深度傾聽相結合,我相信我們正處於兩項重要發現的邊緣。第一個是發現非人類的語言。這是一個非常有爭議的說法,我們可以深入探討。第二個是:我相信我們正處於物種間交流的邊緣。

是什麼樣的技術正在促成這些突破?

數字生物聲學依賴於非常小巧、便攜、輕便的數字錄音機,這些錄音機就像微型麥克風,科學家們正在從北極到亞馬遜的各個地方安裝。您可以將這些麥克風放在海龜或鯨魚的背上。您可以將它們放入深海或最高的山頂,或者將它們連線到鳥類身上。它們可以 24/7 全天候在科學家難以到達的偏遠地區,甚至在黑暗中連續錄音,而且不會產生引入人類觀察員到生態系統中所帶來的干擾。

這種儀器產生了大量資料,這就是人工智慧發揮作用的地方——因為我們在 Google 翻譯等工具中如此有效地使用的相同自然語言處理演算法也可以用於檢測非人類交流中的模式。

這些交流模式的一個例子是什麼?

在我討論特拉維夫大學的約西·約維爾的研究的蝙蝠章節中,有一項特別的研究,他的團隊監測了[近兩]打埃及果蝠兩個半月,並記錄了它們的叫聲。然後,他們調整了一個語音識別程式來分析[15,000 個]聲音,並且該演算法將特定的聲音與透過影片捕獲的特定社互動動相關聯——例如當兩隻蝙蝠爭奪食物時。透過這個,研究人員能夠對大多數蝙蝠的聲音進行分類。這就是約維爾和其他研究人員(例如俄亥俄州立大學的格里·卡特)如何能夠確定蝙蝠的語言比我們以前理解的要複雜得多的原因。蝙蝠會為食物爭吵;它們在彼此交流時區分性別;它們有個人名字,或“簽名呼叫”。母蝙蝠用相當於“母親語”的方式與它們的幼崽說話。但是,當人類母親與嬰兒說話時會提高音調,而母蝙蝠則會降低音調——這會在嬰兒身上引發咿呀學語的反應,隨著嬰兒長大,它們會學會“說”特定的詞語或指代表達訊號。因此,蝙蝠會進行聲音學習。

這是一個很好的例子,說明深度學習如何能夠從這些儀器、所有這些感測器和麥克風中推匯出這些模式,並向我們揭示我們用肉眼無法獲得的東西。因為大多數蝙蝠交流都在超聲波範圍內,超出我們的聽力範圍,並且因為蝙蝠說話速度比我們快得多,所以我們必須放慢速度才能聽到它,並降低頻率。因此,我們無法像蝙蝠一樣聆聽,但我們的計算機可以。下一個見解是,我們的計算機也可以與蝙蝠對話。該軟體產生特定的模式,並使用這些模式與蝙蝠群或蜂巢進行交流,而這正是研究人員現在正在做的事情。

研究人員是如何與蜜蜂對話的?

蜜蜂研究非常有趣。柏林自由大學的研究員蒂姆·蘭格拉夫研究蜜蜂的交流,正如我之前提到的,它是振動和位置性的。當蜜蜂彼此“交談”時,重要的是它們的身體動作以及聲音。現在,計算機,特別是深度學習演算法,能夠跟蹤這一點,因為您可以使用計算機視覺,結合自然語言處理。他們現在已經完善了這些演算法,以至於他們實際上能夠跟蹤單個蜜蜂,並且他們能夠確定一個個體的交流可能對另一隻蜜蜂產生什麼影響。由此產生了破譯蜜蜂語言的能力。我們發現它們有特定的訊號。研究人員給這些訊號起了有趣的名字。蜜蜂會嘟嘟叫;它們會嘎嘎叫。有一種“噓”或“停止”訊號,一種高亢的“危險”訊號。它們有(與蜂群分蜂相關的)鳴笛訊號以及乞求和搖晃訊號,所有這些都指導著集體和個體行為

蘭格拉夫的下一步是將這些資訊編碼到一個名為 RoboBee 的機器人中。最終,經過七到八個原型,他提出了一個可以進入蜂巢的“蜜蜂”,它基本上會發出蜜蜂會服從的命令。因此,蘭格拉夫的蜜蜂機器人可以告訴其他蜜蜂停止,它們就會停止。它還可以做一些更復雜的事情,即非常著名的搖擺舞——這是它們用來向其他蜜蜂傳達花蜜來源位置的交流模式。這是一個很容易進行的實驗,在某種程度上,因為你把花蜜來源放在一個蜂巢中沒有蜜蜂訪問過的地方。然後,你指示機器人告訴蜜蜂花蜜來源在哪裡,然後你檢查蜜蜂是否成功飛到那裡。的確,它們做到了。這個結果只發生過一次,科學家們不確定它為什麼會起作用或如何複製它。但這仍然是一個驚人的結果。

這引發了很多哲學和倫理問題。您可以想象這樣的系統可以用來保護蜜蜂——您可以告訴蜜蜂飛往安全的花蜜來源,而不是飛往受到汙染的花蜜來源,例如,這些花蜜來源的農藥含量很高。您還可以想象這可能是一種馴化以前我們只是不完全馴化的野生物種,或試圖控制其他野生物種行為的工具。關於非人類的複雜程度和複雜交流程度的見解,引發了一些非常重要的哲學問題,即語言作為人類能力的獨特性。

這項技術對我們理解自然世界有什麼影響?

數字生物聲學的發明類似於顯微鏡的發明。當荷蘭科學家安東尼·範·列文虎克開始透過他的顯微鏡觀察時,他發現了微生物世界,這為無數未來的突破奠定了基礎。因此,顯微鏡使人類能夠用我們的眼睛和我們的想象力重新觀看。這裡的類比是,數字生物聲學與人工智慧相結合,就像一個行星尺度的助聽器,使我們能夠用我們經過修復增強的耳朵和我們的想象力重新聆聽。這正在慢慢開啟我們的思想,不僅讓我們認識到非人類發出的美妙聲音,而且讓我們認識到關於所謂的人類與非人類之間的鴻溝、我們與其他物種的關係的一系列基本問題。它還開闢了思考保護和我們與地球關係的新方式。這非常深刻。

索菲·布什威克大眾科學的科技編輯。她負責網站的每日科技新聞報道,撰寫從人工智慧到跳躍機器人等各種文章,用於數字和印刷出版物,錄製 YouTube 和 TikTok 影片,並主持播客科技速遞。布什威克還經常出現在廣播節目(如科學星期五)和電視網路(包括哥倫比亞廣播公司、MSNBC 和國家地理頻道)中。她擁有在紐約市擔任科學記者的十多年經驗,並且曾在大眾科學發現和 Gizmodo 等媒體工作過。在 X(以前稱為 Twitter)上關注布什威克 @sophiebushwick

更多作者:索菲·布什威克
大眾科學雜誌 第 328 卷 第 5 期本文最初以“科技與動物對話”為標題發表於大眾科學雜誌 第 328 卷 第 5 期 (), p. 26
doi:10.1038/scientificamerican0523-26
© .