幾年前,我們中的一人(赫伯特)在超市的過道里漫步時,驚歎於商店如何透過檢查構成產品條形碼的粗細線條的不同順序來跟蹤各種商品。他心想,為什麼不能以類似的方式挖掘 DNA 短鏈中四個核酸的獨特排序,以識別地球上無數的物種呢?
自從卡爾·林奈在 250 年前開始系統地對所有生物進行分類以來,生物學家們一直在觀察各種特徵——顏色、形狀,甚至是行為——來識別動植物。在過去的幾十年裡,研究人員開始將 DNA 中的遺傳資訊應用於這項任務。但是,經典和現代遺傳方法都需要大量的專業知識,並耗費大量的時間。僅使用 DNA 的一小部分——更像產品上的 12 位數字條形碼——將大大減少時間和技能要求。
因此,我們為自己設定了一個挑戰:找到一段 DNA——每個物種的同一基因的同一部分——能夠可靠地區分一個動物物種與另一個物種。展望未來,我們預計很快就會出現一種手持式條形碼閱讀器,類似於 GPS 裝置,能夠從任何微小的組織碎片中“讀取”這樣的片段。繁忙港口的檢查員、山間小徑上的徒步旅行者或實驗室裡的科學家可以將含有 DNA 的樣本——比如說,一小段鬍鬚或昆蟲的腿——插入裝置中,裝置將檢測條形碼片段中核酸的序列。該資訊將立即中繼到參考資料庫,即 DNA 條形碼的公共圖書館,資料庫將回復標本的名稱、照片和描述。任何人、在任何地方都可以識別物種,也可以瞭解某種生物是否屬於以前從未被識別的物種。
支援科學新聞報道
如果您喜歡這篇文章,請考慮支援我們屢獲殊榮的新聞報道,方式是 訂閱。透過購買訂閱,您正在幫助確保未來能夠繼續講述關於塑造我們今天世界的發現和思想的具有影響力的故事。
我們為什麼需要條形碼技術
形態學——動植物的形狀和結構——使科學家能夠命名約 170 萬個物種,這是一項了不起的壯舉,而且形態學仍然是林奈式分類診斷的基礎。然而,僅依靠形態學來描述生命的diversity是有限制的。區分密切相關的物種的細微差別非常複雜,以至於大多數分類學家專注於一組密切相關的生物。因此,需要大量的分類學專家來識別來自單次生物diversity調查的標本。找到合適的專家並分發標本可能既耗時又昂貴。具有高解析度影像的基於網路的資料庫在一定程度上幫助了物流,但其他問題仍然存在。
例如,生物學家估計,約有 800 萬個物種尚未被描述,並且隨著形態學特徵百科全書的擴充套件,簡單地確定標本是否與已知物種相匹配將變得越來越困難。此外,卵和幼年形式(通常比成蟲更豐富)可能沒有明顯的特徵,必須飼養到成熟(如果可能的話)才能被識別。在某些物種中,只能識別一種性別。對於植物來說,標本可以很容易地從花朵中分類出來,而根和其他營養部分則無法區分。一種快速簡便的標準化遺傳資訊使用方法可以彌合這些問題。
使其發揮作用
發現簡化遺傳資訊使用方法是否合理的首要步驟是找到一小段 DNA,它可以實際提供識別結果——這段 DNA 要足夠長,能夠包含區分物種的資訊,但又足夠短,能夠快速高效地使用。經過一些嘗試和錯誤,我們最終確定了一個特定的基因片段作為動物物種的標準參考。(植物是另一回事。)該片段是線粒體(細胞的能量產生亞單位,從母親那裡繼承)中基因的一部分。
我們選擇的基因產生一種叫做細胞色素 c 氧化酶亞基 1 的酶,簡稱 CO1。CO1 條形碼區域足夠小,以至於使用當前技術可以在一次讀取中解讀其核酸鹼基對(著名的雙螺旋的“梯級”)的序列。雖然它只是每個細胞內 DNA 的一小部分,但它捕獲了足夠的變異來區分大多數物種。
例如,在靈長類動物中,每個細胞大約有 35 億個鹼基對。CO1 條形碼只有 648 個鹼基對長,但從人類、黑猩猩和其他大型猿類中提取的例子包含了足夠的差異來區分這些群體。人類在條形碼區域的一個或兩個鹼基對上彼此不同,但我們與我們最近的親戚黑猩猩在大約 60 個位點上存在差異,與大猩猩在大約 70 個位點上存在差異。
線粒體 DNA 被證明特別適用,因為物種之間的序列差異遠多於細胞核 DNA 中的序列差異。因此,線粒體 DNA 的短片段更有可能解析不同的物種。此外,線粒體 DNA 比核 DNA 更豐富,因此更容易回收,尤其是從小而部分降解的樣本中回收。
為了證明這個小的 DNA 標籤實際上可以識別一個物種,我們與我們的同事一起,測試了 CO1 條形碼在來自陸地和海洋、從極地到熱帶的各種動物群體中的有效性。我們發現,CO1 條形碼本身可以區分大約 98% 的透過先前分類學研究識別的物種。在其餘部分中,它們將識別範圍縮小到成對或小群密切相關的物種,通常是最近才分化的譜系或經常雜交的物種。
現在我們已經找到了條形碼,下一步是從身份已經確定的標本中編譯該片段的參考文庫。透過將來自某種生物的條形碼 DNA 與這些“憑證標本”進行比較,研究人員可以確定該生物是已知物種的成員還是新發現。建立文庫的機制很簡單:有人從組織樣本中獲取 DNA,確定條形碼片段的鹼基對序列,並將資訊輸入到條形碼資料庫中。標本的採集更為複雜。每個物種內的變異程度雖然很低,但仍然表明每個物種應至少分析 10 個個體,以記錄這種diversity。即使世界各地的博物館擁有超過 15 億個標本,但大多數標本的製備並沒有考慮到 DNA 回收,而且許多標本都太舊,無法產生完整的條形碼序列。對於作為分類學名稱原始參考文獻的較舊的博物館標本,擴增 100 到 200 個鹼基對的迷你條形碼(這種大小的條形碼通常可以從舊的或損壞的 DNA 中回收)通常就足以證明與具有完整條形碼的年輕標本屬於同一物種。為了幫助構建條形碼文庫,許多機構的研究人員已經開始組裝在儲存 DNA 條件下儲存的大型組織庫。
跟蹤如此多的標本及其序列本身就是一項工程挑戰。但是,該過程已經隨著一個名為生命條形碼資料系統或 BOLD(線上地址為 www.barcodinglife.org)的公共資料庫的建立而開始。BOLD 現在擁有來自動物界 46,000 多個物種的 460,000 多條記錄,其中鳥類、魚類、蝴蝶和蛾類的記錄尤其密集。這些記錄中的每一條都包含物種名稱、條形碼序列、採集地點、指向憑證標本的連結、照片和其他生物學資料。為了幫助協調構建如此全面的文庫所涉及的巨大工作,生命條形碼聯盟 (CBOL) 於 2005 年成立;它包括來自 45 個國家的 150 個機構,這些機構支援將 DNA 條形碼技術發展成為物種識別的全球標準。記錄的實際組裝將由國際生命條形碼專案推動:這是一個 25 個國家的聯盟,計劃到 2014 年處理來自 500,000 個物種的 500 萬個標本。
我們迄今為止學到了什麼
正如 E. O. 威爾遜指出的那樣,儘管經過 250 年的努力,我們甚至不知道地球上究竟有多少物種,即使是最近的數量級也不知道。DNA 條形碼技術已經在幫助加速生物diversity的編目。迄今為止的主要發現之一是,物種比科學家意識到的要多——每個物種的專業化程度更高。這一啟示來自於條形碼技術提供的關於所謂隱生物種的新資訊,這些生物物種看起來相似,但遺傳差異表明它們是不同的物種。
DNA 條形碼調查顯示,在迄今為止研究的每個群體中,博物館抽屜裡都潛伏著隱生物種。例如,赫伯特與賓夕法尼亞大學的生物diversity生態學家丹尼爾·揚岑以及史密森學會的分類學家約翰·伯恩斯及其在哥斯大黎加的同事發現,曾經被認為是一個物種的弄蝶Astraptes fulgerator,實際上至少是 10 個不同的物種。由於成蟲非常相似,科學家們沒有意識到它們在基因上如此不同。同樣,安大略省生物diversity研究所的亞歷克斯·史密斯及其同事發現,三種形態可識別的寄生多種昆蟲的蠅類實際上是 15 個物種的集合,每個譜系都專門寄生於少數寄主。
我們中的一人(斯托克爾)的工作表明,即使在經過非常深入研究的群體(北美鳥類)中,大約 4% 的已命名物種也包含可能屬於不同物種的基因上不同的譜系。
最引人注目的早期發現之一是大多數動物物種內線粒體遺傳diversity的驚人低水平。這一發現與群體遺傳學理論的一個預測相矛盾,該理論預測較老或較大的種群應該表現出更多的diversity。變異水平低通常被認為表明最近的種群瓶頸。例如,科學家們認為,人類種群中線粒體變異的相對缺乏表明早期人類在 15 萬年前在東非幾乎滅絕。根據這一假設,所有現代人類都追溯到這個時期的單身女性,即所謂的線粒體夏娃。在整個動物界普遍存在類似貧乏的遺傳diversity水平的發現,讓人對夏娃假說產生懷疑,並提出了一個更大的未解決的科學問題:是什麼力量限制了物種內的線粒體diversity?我們和其他人認為,序列分歧的持續低水平反映了頻繁的“選擇性清除”,在這種清除中,新的、有利的突變取代了祖先的變異,從而修剪了物種內的diversity。
我們迄今為止的研究表明,條形碼技術可以加速生物diversity的調查。然而,事實仍然是,新物種的正式描述可能需要數年才能完成。因此,序列資料的生成遠遠領先於官方物種描述。我們認為條形碼技術正在建立一張 DNA diversity地圖,該地圖將作為後續詳細研究的框架。正如航空攝影的速度和經濟性使其取代地面調查成為土地分析的第一線一樣,DNA 條形碼技術可以成為物種發現中快速、相對廉價的第一步。“地面實況調查”將需要更多時間。但是,將這些方法聯絡起來將產生對地球上生命的歷史和現狀的綜合看法,並有助於引導生命的全部輝煌進入未來的世紀。
有關此故事的圖表,請單擊下面的影像放大
注意:本文最初以“生命條形碼”為標題發表。
