乍一看,這份動物名單可能讓人聯想到任何動物園。這裡有大象、犰狳、負鼠、海豚、樹懶、刺蝟、大小蝙蝠、幾隻鼩鼱、一些魚、獼猴、猩猩、黑猩猩和大猩猩——僅舉幾個比較熟悉的生物。但這個動物集合與之前構建的任何動物園都截然不同。這裡沒有籠子,沒有特許攤位,實際上也沒有動物。這是一個“虛擬”動物園,僅包含這些動物的 DNA 序列——構成每個物種的遺傳配方的數億到數十億個 DNA 程式碼字母。
最興奮的這個新分子動物園的參觀者是進化生物學家,因為其中蘊藏著進化的大量詳細記錄。幾十年來,科學家們一直渴望瞭解物種的巨大多樣性是如何產生的。半個世紀以來,我們都知道,從體色到大腦大小,身體特徵的變化源於 DNA 的變化。然而,直到最近,確定廣闊的 DNA 序列中哪些變化導致動物具有獨特的外觀仍然遙不可及。
生物學家現在正在破譯 DNA 記錄,以找到使不同種類的蒼蠅、魚類或雀類彼此看起來不同,以及使我們人類與黑猩猩不同的指令。這項探索導致了我們觀點的深刻改變。在過去 40 年左右的大部分時間裡,研究人員將大部分注意力集中在基因上——DNA 中編碼形成蛋白質的氨基酸鏈的核苷酸序列。但令我們驚訝的是,事實證明,外觀上的差異具有欺騙性:非常不同的動物具有非常相似的基因組。透過追尋進化的軌跡,人們在 DNA 中發現了裝置——基因“開關”——它們不編碼任何蛋白質,但調節基因在何時和何地被使用。這些開關的變化對於解剖結構的進化至關重要,併為動物王國看似無窮無盡的形態是如何進化的提供了新的見解。
支援科學新聞報道
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保有關塑造我們當今世界的發現和思想的有影響力的故事的未來。
解剖基因和編碼悖論 長期以來,科學家們當然期望動物之間的解剖學差異會反映在其基因組內容的明顯差異中。然而,當我們比較哺乳動物基因組(如小鼠、大鼠、狗、人類和黑猩猩的基因組)時,我們發現它們各自的基因目錄非常相似。每種動物基因組中基因的大概數量(大約 20,000 個左右)和許多基因的相對位置在超過 1 億年的進化過程中都得到了很好的維護。這並不是說基因數量和位置沒有差異。但乍一看,這些基因清單中沒有任何東西在喊“小鼠”或“狗”或“人類”。例如,在比較小鼠和人類基因組時,生物學家能夠為我們至少 99% 的基因識別出小鼠對應物。
換句話說,我們人類並沒有像某些人曾經認為的那樣,比我們的寵物、害蟲、家畜甚至河豚擁有更多的基因。也許令人失望,但我們必須克服它。
當生物學家詳細觀察單個基因時,物種之間的相似性也是普遍規律。任何兩個基因版本的 DNA 序列,以及它們編碼的蛋白質,通常都非常相似,其程度僅僅反映了自這兩個物種從共同祖先分化以來經過的相對時間量。當人們考慮到參與身體構建和身體模式形成的基因時,編碼序列在進化時間上的這種儲存尤其令人費解。
在所有基因中,只有一小部分——不到 10%——致力於在動物從受精卵到成蟲的發育過程中構建和模式化動物身體。其餘的則參與各種器官和組織內細胞的日常任務。動物之間的解剖學差異——身體部位的數量、大小、形狀或顏色的差異——必然在某種程度上與身體構建基因有關。事實上,對與解剖結構發育相關的基因和過程在進化中發揮的關鍵作用的研究甚至贏得了自己的綽號:evo-devo(進化發育生物學)。對於我們這些該領域的研究專家來說,發現身體構建蛋白質平均而言甚至比其他蛋白質更相似尤其令人感興趣,因為它似乎提出了一個悖論:像小鼠和大象這樣不同的動物是由一組非常相似、功能上無法區分的身體構建蛋白質塑造的。同樣的道理也適用於人類和我們最親近的現存親屬——我們的大多數蛋白質與黑猩猩的蛋白質相比,僅在一個或兩個由數百個氨基酸組成的氨基酸上存在差異,而且我們 29% 的蛋白質在序列上完全相同。我們如何解釋蛋白質和解剖結構這兩個水平的進化之間的這種差異?在所有這些基因組 DNA 中,必然存在有意義的進化差異。訣竅是找到它們,而找到它們的訣竅是決定在哪裡尋找。事實證明,這些位置比基因本身更難找到。
基因開關 在人類中,DNA 的蛋白質編碼片段僅佔我們基因組的約 1.5%,因此基因實際上就像 DNA 序列浩瀚海洋中的小資訊島嶼。剩餘的非編碼 DNA 大部分我們不知道有什麼作用,但其中一些序列參與了非常重要的基因表達調控任務。而這些調控序列是進化的關鍵。
基因的表達需要將 DNA 序列轉錄成信使 RNA (mRNA) 版本,並將 mRNA 翻譯成蛋白質序列。大多數基因的表達在轉錄水平上受到調控——細胞不會浪費能量來製造它們不需要的 mRNA 和蛋白質。因此,許多基因僅以器官、組織或細胞型別特異性的方式表達。某些非編碼 DNA 序列在指導何時何地發生這種情況方面起著至關重要的作用。它們是“基因開關”的組成部分,這些開關在身體的正確時間和地點開啟或關閉基因。序列特異性 DNA 結合蛋白(稱為轉錄因子,它是開關的其他組成部分)識別這些 DNA 序列,通常稱為增強子。轉錄因子與細胞核內增強子的結合決定了該細胞中的開關和基因是開啟還是關閉。
每個基因至少有一個增強子。與基因本身不同,基因本身的編碼區域由於遺傳密碼相當簡單的語法而很容易識別,增強子不能僅根據其 DNA 序列來識別,必須透過實驗來識別。增強子通常有數百個鹼基對的長度,可能位於基因的任一側,甚至位於基因內部的非編碼片段中。它們也可能距離基因本身數千個核苷酸。
對於我們在此處的討論最重要的是,一些基因有許多獨立的增強子。對於編碼塑造解剖結構的蛋白質的基因尤其如此。每個增強子獨立地調節基因在身體不同部位和動物生命週期不同時期的表達,因此基因的完整表達是多個獨立控制的表達位點的拼湊而成。這些增強子使同一個基因可以在不同的背景下多次使用,從而極大地擴充套件了單個基因的功能通用性。
果蠅身體部位著色基因說明了這個基因調控系統的模組化邏輯。這個名字有些令人困惑的 Yellow 基因編碼一種促進黑色素形成的蛋白質(沒有這種蛋白質的突變蒼蠅是 Yellow)。Yellow 基因具有獨立的增強子,可以在各種果蠅身體部位(包括翅膀和腹部)的發育過程中啟用它。
由於 Yellow 基因在許多組織的發育過程中發揮作用,因此基因本身的突變如果改變或停用蛋白質的功能,可能會是災難性的;它們會影響整個生物體中 Yellow 色素蛋白的功能。相比之下,僅基因的一個增強子的變化只會影響該增強子的功能,並且只會影響由該增強子控制的 Yellow 基因表達,而蛋白質在其他組織中的表達和功能保持不變。
身體模式形成基因模組化調控的進化意義是深遠的。從理論上講,增強子中的突變將允許選擇性地修飾個體身體特徵,而無需改變基因或蛋白質本身。在過去幾年中,直接證據表明,這通常是各種身體部位和模式進化發生的方式。
進化的開關 生物學中最重要的策略之一是識別人們希望理解的現象的最簡單實驗模型。關於身體模式的進化,顏色最符合要求。它是動物最明顯的特徵之一,並在動物與其環境和彼此之間的相互作用中發揮著重要作用。果蠅的體色模式在密切相關的物種中迅速多樣化,對果蠅如何獲得斑點和條紋的分析說明了基因開關的進化如何以及為何塑造瞭解剖結構的進化。
在某些物種中,雄性翅膀邊緣有強烈的黑點,而其他物種則沒有這些斑點。在某些相同的物種中,雄性腹部非常黑(這也是最著名的果蠅 Drosophila melanogaster 得名的原因:melanogaster 意思是“黑腹”),而其他物種的雄性則沒有這條黑帶。在翅膀有斑點的物種中,雄性在跳舞求偶時會向雌性展示它的斑點。我們發現,在有斑點的物種中,Yellow 蛋白質在將形成斑點的細胞中產生量非常高,而在翅膀細胞的其他部分產生量很低。在沒有斑點的物種中,Yellow 僅在整個翅膀中以低水平產生,僅產生一層淡淡的黑色素。
為了弄清楚 Yellow 如何在某些物種的翅膀斑點中產生而在其他物種中不產生,我們在 Yellow 基因周圍的 DNA 序列中搜索了控制其在身體各個部位表達的增強子。在沒有斑點的物種中,有一個增強子驅動 Yellow 在翅膀中以低均勻模式表達。這種翅膀增強子活性產生了果蠅翅膀的淺灰色。當分析來自有斑點物種的相應 DNA 片段時,我們發現它既驅動這種低水平模式,又驅動基因表達的強烈斑點模式。在有斑點物種的進化過程中發生的是,在翅膀中產生的轉錄因子的新結合位點在 Yellow 翅膀增強子 DNA 序列中進化出來。這些變化創造了一種表達模式——翅膀斑點——而沒有改變 Yellow 蛋白質在身體其他部位的產生位置或功能 [見方框]。
一個類似的故事適用於腹部黑帶的進化,但有一個轉折。雖然我們自然而然地認為,一個特徵在一個物種中存在而在另一個相關物種中不存在是前者獲得的結果,但情況往往並非如此。進化的另一面,特徵的喪失,非常普遍,儘管遠未受到重視。身體特徵的喪失也許最好地說明了為什麼增強子的進化是解剖結構進化的更可能途徑。
Yellow 基因的一個增強子控制其在腹部的表達。在具有黑帶的物種的雄性中,這個增強子驅動 Yellow 基因在腹部後部的細胞中以高水平表達。但是一些物種,例如 Drosophila kikkawai,在進化過程中失去了這條色素帶。在 D. kikkawai 中,增強子不再能夠驅動 Yellow 在腹部後部的高水平表達,因為一些突變破壞了它的一些轉錄因子結合位點。
重要的是要強調,Yellow 基因在身體的其他部位仍然活躍,並且它的生化功能完好無損。雖然失去黑帶的一種途徑可能是透過使 Yellow 基因及其蛋白質失活的突變,但自然選擇不允許這條途徑,因為 Yellow 功能在身體其他部位的喪失會產生額外的、不利的後果。
特徵的喪失可能對生存或更大的生殖成功有利也可能不利,但有些喪失是適應性的,因為它們促進了生活方式的某些改變。例如,後肢在脊椎動物中已經多次喪失——蛇、蜥蜴、鯨魚和海牛——這些喪失與適應不同的棲息地和運動方式有關。四足脊椎動物後肢的進化先驅是魚類的腹鰭。腹鰭解剖結構的巨大差異也在密切相關的魚類種群中進化出來。三刺魚在北美許多湖泊中以兩種形式存在——一種具有完整多刺骨盆的開闊水域形式,以及一種骨盆明顯縮小和棘刺萎縮的淺水、底棲形式。在開闊水域中,長長的棘刺有助於保護魚類免受較大捕食者的吞噬。但在湖底,這些棘刺是一種累贅,因為以幼魚為食的蜻蜓幼蟲可以抓住它們。
這些魚類之間骨盆形態的差異在自上次冰河時代以來短短 10,000 年的時間裡反覆進化出來。長棘刺的海洋刺魚殖民了許多獨立的湖泊,而縮小的形式則獨立進化了多次。由於這些魚類親緣關係非常近,並且在實驗室中可以雜交,因此遺傳學家可以繪製出與刺魚骨盆縮小有關的基因。斯坦福大學的 David M. Kingsley 與不列顛哥倫比亞大學的 Dolph Schluter 及其同事一起表明,與骨盆骨骼構建相關的基因表達的變化與骨盆縮小有關。與大多數其他身體構建基因一樣,Pitx1 基因在魚類的發育中具有多項任務。但它的表達在將產生骨盆鰭芽和棘刺的魚類區域中被選擇性地喪失。再一次,增強子的進化變化是罪魁禍首。不同形式的刺魚之間的 Pitx1 蛋白質沒有編碼變化。
Yellow、Pitx1 和大多數其他身體構建和身體模式形成基因被認為是多效性的,因為它們影響多種性狀的形成或外觀。多效性基因編碼序列的突變對該基因控制的所有性狀都有多種影響,而這種劇烈的變化不太可能被自然選擇所容忍。從斑點、條紋和骨骼的進化中得出的關鍵教訓是,調控序列中的突變規避了編碼序列突變的多效性效應,並允許選擇性地修飾個體身體部位。調控序列中的突變並非唯一的進化模式——當基因具有多種作用,並且其中一種作用被選擇性地修飾時,它們只是更可能的途徑。
共同的基因,無窮的變化 增強子的進化根本不侷限於影響身體形態的基因,也不僅僅侷限於果蠅和奇怪的魚類。對於人類特徵而言,也已經證明了許多調控序列進化變化改變基因表達的例子。
在最近的人類進化中,一個更引人注目的案例代表了透過選擇性喪失基因表達來適應瘧疾流行的環境。除了熟悉的 A、B 和 O 血型外,其他所謂的次要血型也得到了充分研究。紅細胞表面上存在的一種名為 Duffy 的蛋白質的狀態定義了這些型別中的一種。Duffy 蛋白質構成了導致瘧疾的寄生蟲 Plasmodium vivax 用來感染紅細胞的受體的一部分,但在西非,幾乎 100% 的人口的血細胞中都缺乏這種蛋白質,這使得個體能夠抵抗感染。Duffy 基因也在其他幾種身體組織中表達,包括脾臟、腎臟和大腦的細胞。在非洲人群中,Duffy 在這些其他組織中的表達得到了保留。毫不奇怪,這些 Duffy 陰性個體攜帶 Duffy 基因增強子中的突變,該突變敲除了啟用紅細胞前體中 Duffy 表達的轉錄因子的結合位點,但對其他部位的 Duffy 產生沒有影響。
杜克大學的 Gregory A. Wray 和他的合作者已經確定了人類生物學的其他方面,這些方面是透過不同人類基因增強子中的突變進化而來的。迄今為止揭示的最有趣的關聯之一涉及控制 Prodynorphin 基因的大猿和人類調控序列的差異,該基因編碼一組在大腦中產生並參與感知、行為和記憶的小型阿片類蛋白質。人類基因比黑猩猩版本對刺激的反應表達更高,並且強有力的證據表明,人類調控序列在自然選擇下進化而來——也就是說,它被保留是因為它是有利的。
正如這些例子所示,調控 DNA 中的突變無疑在人類進化中發揮了作用,調控變異也可能是個體之間身體和健康差異的重要來源。由於科學家無法像對果蠅和魚類那樣對活人的 DNA 進行修補,因此研究某些導致我們與其他物種分化的調控 DNA 變化的例子有些困難,儘管一些分析基因組的新方法正在產生令人鼓舞的線索 [見方框]。
對基因調控 DNA 序列進化的研究仍處於早期階段。虛擬基因組動物園中的數十萬個基因開關尚未被發現或研究。然而,生物學家已經開始學習新的原理,這些原理對未來的研究具有預測價值:解剖結構的進化變化,特別是涉及多效性基因的進化變化,更有可能透過基因增強子的變化而不是基因本身的變化發生。
這種現象也揭示了非常不同的動物群體如何共享大部分(如果不是全部)參與身體構建和身體模式形成的基因——這與科學家早期的預期相反,這主要是關於如何以及何時使用這些基因來塑造動物王國的不同形態。如果我們真的想了解是什麼使人類形態不同於其他猿類,或者是什麼使大象不同於小鼠,那麼,大部分資訊不在於我們各自的基因和蛋白質,而在於我們基因組中一個完全不同的領域,這個領域仍有待探索。
編者注:本文最初的標題為“調控進化”
