生命的密碼的意外來源

新興資料表明看似不可能的事——神秘的新基因從“垃圾”DNA中產生

來自 誇塔雜誌 (在此處查詢原始故事)。

基因和人一樣,也有家族——譜系可以追溯到很久以前的創始成員。那位祖先不斷繁殖和擴散,每次迭代都略有變形。

在過去 40 年的大部分時間裡,科學家們認為這是新基因誕生的主要方式——它們只是從現有基因的副本中產生的。舊版本繼續執行其工作,新副本則可以自由進化出新功能。


支援科學新聞報道

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保有關發現和塑造我們當今世界的想法的具有影響力的故事的未來。


然而,某些基因似乎違背了這種起源故事。它們沒有已知的親屬,並且與任何其他基因都不相似。它們就像是在偏遠雨林深處發現的神秘野獸的分子等價物,一種生物謎題,似乎與地球上的任何其他事物無關。

這些孤兒基因從何而來之謎困擾了科學家數十年。但在過去幾年中,一種曾經離經叛道的解釋迅速獲得了勢頭——許多孤兒基因是從所謂的垃圾 DNA 或非編碼 DNA(基因之間神秘的 DNA 片段)中產生的。“遺傳功能以某種方式突然出現,”加州大學戴維斯分校的生物學家大衛·貝根說。

這種蛻變曾經被認為是不可能的,但是從酵母菌和果蠅到小鼠和人類等生物體中越來越多的例子已經使該領域的大多數人相信,這些從頭基因確實存在。一些科學家說它們甚至可能很常見。就在上個月,在維也納舉行的分子生物學和進化學會上提出的研究報告確定了 600 個潛在的新人類基因。“從頭基因的存在應該是一件罕見的事情,”巴塞羅那海洋醫院研究所的進化生物學家瑪爾·阿爾巴說,他介紹了這項研究。“但是人們已經開始越來越多地看到它。”

研究人員開始認識到從頭基因似乎構成了基因組的重要組成部分,但科學家們幾乎不知道有多少基因或它們的作用是什麼。更重要的是,這些基因的突變會引發災難性的失敗。“看起來這些新基因往往是最重要的基因,”德國明斯特大學的生物資訊學家埃裡希·博恩伯格-鮑爾說。

新基因似乎在小鼠譜系(紅線)的進化歷史中的各個點爆發式出現。大約 8 億年前的激增與地球從“雪球”階段(當時地球幾乎完全冰凍)中脫離出來的時間相對應。最近的峰值代表新生的基因,其中許多基因隨後將丟失。如果所有基因都透過複製產生,那麼它們都將在生命起源後不久(大約 38 億年前)產生(綠線)。
奧萊納·施馬哈洛/誇塔雜誌;來源:Tautz 和 Domazet-Lošo,《自然評論:遺傳學》,2011 年。

孤兒基因追逐
標準的基因複製模型解釋了數千個已知的基因家族,但它有侷限性。它暗示大多數基因創新都發生在生命歷史的早期。根據這個模型,35 億年前的最早的生物分子會創造出一組遺傳構建塊。然後,生命的每次新迭代都將僅限於調整這些構建塊。

然而,如果生命的工具箱如此有限,進化如何產生我們今天在地球上看到的龐大動物群?“如果新部件僅來自舊部件,我們將無法解釋發育的根本變化,”博恩伯格-鮑爾說。

嚴格的複製模型可能不足以滿足需求的第一個證據出現在 20 世紀 90 年代,當時 DNA 測序技術開始普及。研究人員分析酵母基因組後發現,該生物體三分之一的基因與其他生物體中已知的基因沒有相似之處。當時,許多科學家認為這些孤兒基因屬於尚未被發現的家族。但這種假設並未被證實。在過去的十年中,科學家們對來自數千種不同生物體的 DNA 進行了測序,但許多孤兒基因仍然無法分類。它們的起源仍然是個謎。

2006 年,貝根發現了一些最早的證據,證明基因確實可以從非編碼 DNA 中突然出現。他將標準實驗室果蠅黑腹果蠅的基因序列與其他密切相關的果蠅物種進行了比較。不同的果蠅共享其基因組的絕大部分。但是貝根和合作者發現了幾種基因,這些基因僅存在於一兩個物種中,而其他物種中則不存在,這表明這些基因不是現有祖先的後代。貝根轉而提出,果蠅基因組中隨機序列的垃圾 DNA 可能會突變成功能基因。

然而,從隨機 DNA 序列建立基因似乎與將一罐拼字遊戲瓷磚倒在地板上並期望這些字母拼出連貫的句子一樣不可能。垃圾 DNA 必須積累突變,使其能夠被細胞讀取或轉化為 RNA,以及指示基因應在何時何地活躍的調控元件。就像句子一樣,基因必須有開頭和結尾——指示其開始和結束的短程式碼。

此外,基因產生的 RNA 或蛋白質必須有用。新生的基因可能會被證明是有毒的,產生有害的蛋白質,例如那些在阿爾茨海默病患者大腦中聚集在一起的蛋白質。“蛋白質有很強的錯誤摺疊和造成嚴重破壞的趨勢,”亞利桑那大學圖森分校的生物學家喬安娜·馬塞爾說。“很難想象如何從隨機序列中獲得一種新的蛋白質,因為你期望隨機序列會造成如此多的麻煩。”馬塞爾正在研究進化可能繞過這個問題的方法。

貝根假設的另一個挑戰是,很難區分真正的從頭基因與從其祖先發生巨大變化的基因。(鑑定真正的從頭基因的難度仍然是該領域爭論的焦點。)

十年前,馬克斯·普朗克進化生物學研究所的生物學家迪特哈德·陶茨是許多對貝根的想法持懷疑態度的研究人員之一。陶茨為孤兒基因找到了其他解釋。一些神秘基因進化得非常快,使其祖先無法識別。其他基因是透過重組現有基因的片段而產生的。

然後他的團隊偶然發現了Pldi基因,他們以德國足球運動員盧卡斯·波多爾斯基的名字命名了該基因。該序列存在於小鼠、大鼠和人類中。在後兩個物種中,它保持沉默,這意味著它不會轉化為 RNA 或蛋白質。DNA 僅在小鼠中活躍或轉錄為 RNA,在小鼠中,它似乎很重要——沒有它的雄鼠精子速度較慢,睪丸較小。

研究人員能夠追溯將沉默的非編碼 DNA 片段轉化為活性基因的一系列突變。這項工作表明,新基因是真正的從頭基因,並排除了另一種可能性——它屬於現有的基因家族,只是進化到無法識別的程度。“那時我才想,好吧,這一定是可能的,”陶茨說。

新基因浪潮
科學家們現在已經編目了許多明確的從頭基因的例子:一種酵母基因,它決定它是進行有性繁殖還是無性繁殖;一種果蠅和其他雙翅目昆蟲的基因,它對於飛行變得至關重要;以及一些僅在人類中發現的基因,其功能仍然令人著迷地不清楚。

在上個月的分子生物學和進化學會會議上,阿爾巴和合作者使用強大的 RNA 分析新技術,在人類和黑猩猩中鑑定出數百個推定的從頭基因——比之前的研究多十倍。在阿爾巴團隊發現的 600 個人類特有基因中,有 80% 是全新的,以前從未被鑑定過。

不幸的是,破譯從頭基因的功能遠比鑑定它們困難得多。但至少其中一些基因並沒有做基因等價於無所事事的事情。有證據表明,一部分從頭基因很快變得至關重要。果蠅中約 20% 的新基因似乎是生存所必需的。許多其他基因也顯示出自然選擇的跡象,這證明它們正在為生物體做一些有用的事情。

在人類中,至少有一個從頭基因在大腦中活躍,這導致一些科學家推測,此類基因可能有助於推動大腦的進化。其他基因在突變時與癌症有關,這表明它們在細胞中具有重要功能。“失調會產生如此毀滅性的後果這一事實意味著正常功能是重要或強大的,”都柏林三一學院的遺傳學家奧伊夫·麥克萊薩特說,他鑑定了第一個人類從頭基因

混亂的蛋白質 從頭基因也是更大轉變的一部分,是我們對蛋白質外觀及其工作方式的概念的改變。從頭基因通常很短,並且產生小蛋白質。從頭蛋白質不是摺疊成精確的結構(蛋白質行為方式的傳統概念),而是具有更無序的結構。這使得它們有點鬆軟,使蛋白質能夠與更廣泛的分子結合。在生物化學術語中,這些年輕的蛋白質是混亂的。

科學家們對這些較短的蛋白質的行為方式知之甚少,這主要是因為標準篩選技術往往會忽略它們。大多數用於檢測基因及其相應蛋白質的方法都會挑選出與現有基因具有一定相似性的長序列。“很容易錯過這些,”貝根說。

這種情況正在開始改變。隨著科學家們認識到較短蛋白質的重要性,他們正在實施新的基因發現技術。因此,從頭基因的數量可能會激增。“我們不知道較短的基因會做什麼,”馬塞爾說。“關於它們在生物學中的作用,我們還有很多東西要學習。”

科學家們還想了解從頭基因如何被納入驅動細胞的複雜反應網路,這是一個特別令人費解的問題。這就像一輛腳踏車自發地長出一個新零件,並迅速將其納入其機械裝置中,即使沒有它,腳踏車也能正常工作。“問題令人著迷,但完全未知,”貝根說。 

一種名為 ESRG 的人類特有基因特別好地說明了這個謎團。在猴子和其他靈長類動物中發現了一些序列。但它僅在人類中活躍,在人類中,它對於維持最早的胚胎幹細胞至關重要。然而,猴子和黑猩猩在沒有它的情況下也能很好地製造胚胎幹細胞。“這是一種人類特有基因,它執行的功能必定早於該基因,因為其他生物體也具有這些幹細胞,”麥克萊薩特說。

“新基因如何變得有功能?它如何被納入實際的細胞過程?”麥克萊薩特說。“對我來說,這是目前最重要的一個問題。”

經 誇塔雜誌許可轉載,誇塔雜誌是 西蒙斯基金會的編輯獨立出版物,其使命是透過報道數學以及物理和生命科學領域的研究進展和趨勢,增進公眾對科學的理解。

© .