擁有 18.2 萬片葉子的龐大資料庫正在幫助預測植物家譜

這項技術可用於從花朵到細胞的一切事物,以檢查影響植物部分形狀的因素

植物的故事銘刻在它的葉片中。生長在水分充足的寒冷環境中的樹木更可能擁有邊緣有許多鋸齒的大葉片。但是,如果同一物種生活在溫暖乾燥的地區,它的葉片可能更小更光滑

現在,一本追蹤來自世界各地 141 個植物科和 75 個地點的 18.2 萬片葉片形狀的圖集,顯示出有望提高科學家解讀這個故事的能力。研究人員利用該圖集發現,僅葉片形狀就能準確預測葉片採集地點,準確率達 14.5%,正確預測植物科,準確率達 27.3%。這遠優於使用傳統方法描述葉片形狀所做的預測。

研究人員希望這種方法將幫助他們更多地瞭解塑造植物葉片的力量,甚至可以透過分析化石植物的形狀來了解古代氣候。德克薩斯州韋科市貝勒大學的古植物學家丹·佩佩說:“這是一個驚人的資料集。我們越來越接近葉片形狀測量的自動化,並利用它來弄清植物的分類學並重建氣候。”


關於支援科學新聞

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保有關塑造我們當今世界的發現和想法的有影響力的故事的未來。


研究結果已釋出在生物學預印本伺服器 bioRxiv 上,釋出日期為 6 月 20 日。植物形態學家兼主要作者丹·奇特伍德還在 6 月 27 日在德克薩斯州沃斯堡舉行的 2017 年植物學會議上介紹了這項研究。

塑造資料

奇特伍德,前密蘇里州聖路易斯市唐納德·丹佛斯植物科學中心的研究人員,和他的同事們彙集了他們自己關於特定植物群(如葡萄和番茄植物)的研究資料,以及來自旨在編目更廣泛植物物種和地點的幾個大型資料集。

然後,他們使用一種稱為持久同源性的拓撲方法來分析每片葉片的形狀。該方法根據影像中畫素周圍畫素的密度為每個畫素分配一個值。研究小組將每片葉片分成 16 個部分,並分析了每個部分的值模式。研究人員使用由此產生的葉片形狀目錄來尋找物種之間的分類學和地理關係。

奇特伍德的最終目標是重建葉片“形態空間”:所有可能的葉片形狀的完整目錄。“如果你可以測量目前存在的所有葉片和曾經存在的所有葉片,它會是完全隨機的嗎?”他問道。“或者是否會有些葉片從未出現過?是因為植物無法制造它們嗎?”

持久同源性已被用於繪製從神經元網路到樂句結構的一切事物,奇特伍德希望它可以為分析植物的所有部分提供一種統一的方法。其他人也渴望將相同的方法應用於他們自己的研究需求。維也納大學的植物形態學家揚尼克·施泰德勒希望使用這項技術來分析他不斷增長的花朵 X 射線影像庫。他希望這將有助於他克服傳統形態學方法的一個障礙,其中許多方法涉及在影像上放置地標(在不同物種中重複出現的結構上的點)。

他說,這些技術對動物效果很好,動物往往有明顯的標誌:兩塊骨頭相遇的點、眼睛的角落、鼻子的尖端。但花朵通常具有光滑的曲面,這使得研究人員難以精確定位特定地標。“這在葉片和花朵中一直是一個可怕的問題,”施泰德勒說。“它阻礙了我們。”

逐葉分析

像佩佩這樣的古植物學家希望找到自動化分析化石葉片的方法——這個過程目前需要艱苦的工作才能手動在化石上放置地標進行分析。

其他專案正在分析植物特徵,包括葉片、果實和花朵,以使研究人員和愛好者能夠在野外快速識別它們。法國蒙彼利埃國際發展農業研究中心的植物學家皮埃爾·邦內特說,例如,一個名為 Pl@ntNet 的專案透過手機應用程式收集了來自世界各地使用者提交的數百萬張影像。到目前為止,該專案已使用機器學習技術分析了來自 13,000 種植物的 580,000 張影像。

邦內特的合作者之一,法國蒙彼利埃計算機科學與自動化研究所的計算機科學家亞歷克西斯·喬利說,Pl@ntNet 在識別植物方面比奇特伍德的圖集更好。他補充說,該團隊尚未將 Pl@ntNet 用於研究葉片形狀的多樣性。

奇特伍德希望將他的拓撲方法的結果輸入到機器學習演算法中,以檢視這些演算法是否可以改進他的分類學和地理預測。但他表示,他更感興趣的是理解葉片形狀,而不是對植物進行分類。

施泰德勒說,曾經有一段時間,似乎理解植物形態的努力正在消亡。但該領域正在經歷復興,部分原因是廣泛努力表徵植物(特別是作物)的性狀,並瞭解遺傳和環境如何影響它們。

“形態學正在重生,”施泰德勒說。“這就是該領域的發展方向。而且我認為,特別是與遺傳資料相結合,我們擁有非常光明的未來。”

本文經許可轉載,並於 2017 年 7 月 7 日首次發表

© .