長期以來,生物學家們認為他們瞭解基因突變如何導致疾病。但最近的研究揭示了故事中一個重要的轉折,並揭示了 DNA 改變使人生病的令人驚訝甚至違反直覺的方式。傳統的觀點認為,所謂的“沉默”突變對健康無關緊要,因為 DNA 中的這種變化不會改變基因編碼的蛋白質的組成。蛋白質在細胞執行的幾乎所有過程中都發揮作用,從催化生化反應到識別外來入侵者。因此,人們認為,如果蛋白質的構成最終是正確的,那麼導致其構建過程中的任何小故障都不會對身體造成傷害。
然而,偵探工作偶爾會將一種疾病追溯到沉默突變,即使研究人員認為這不可能是罪魁禍首。基因組進化研究中也出現了類似的謎團,各種物種 DNA 變化模式表明,許多沉默突變被長期儲存下來,這表明它們對擁有它們的生物體是有用的。在許多物種中,這些變化似乎有助於細胞更有效地製造蛋白質,但在人類中則不然。
現在,研究人員開始梳理沉默突變可能對人類健康和疾病產生的影響。研究結果表明,為改進基因療法和基因工程的設計提供了有趣的新途徑。
支援科學新聞
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保未來能夠持續報道關於塑造我們今天世界的發現和思想的具有影響力的故事。
同義但不同
當人們觀察細胞製造蛋白質的方式時,基因突變如何不影響蛋白質就變得清晰了。基本公式很簡單:DNA 核苷酸鏈產生幾乎相同的 RNA 核苷酸序列,然後 RNA 核苷酸序列被翻譯成氨基酸鏈,氨基酸鏈整齊地摺疊成蛋白質。這種核酸字母表的字母透過它們的化學鹼基來區分——DNA 中的腺嘌呤 (A)、胞嘧啶 (C)、鳥嘌呤 (G) 和胸腺嘧啶 (T),RNA 中用尿嘧啶 (U) 代替胸腺嘧啶。
換句話說,編碼在核酸中的指令必須轉換成氨基酸的語言,以便它們的“意義”(有用的蛋白質)能夠被表達。當基因被“表達”時,DNA 雙螺旋的兩條鏈分離,細胞機制將沿著單鏈的核苷酸序列轉錄成 RNA 的副本。然後,這種信使 RNA (mRNA) 轉錄本通常必須被編輯成更簡短的形式,然後才能被核糖體和稱為轉移 RNA (tRNA) 的較小 RNA 翻譯成蛋白質。當核糖體沿著 mRNA 移動時,tRNA 到達以遞送編碼的氨基酸。每個 tRNA 攜帶一個特定的氨基酸,並且大多數 tRNA 能夠識別 mRNA 鏈中僅一個特定的三核苷酸序列。當 tRNA 遇到其 mRNA 匹配項時,核糖體將 tRNA 的氨基酸貨物新增到正在增長的氨基酸鏈中。
細胞用來將 DNA 和 RNA 語言翻譯成蛋白質的程式碼——著名的遺傳密碼——因此僅僅是控制哪個 tRNA 攜帶哪個氨基酸的規則集。這個程式碼有一個關鍵特徵:它是冗餘的。所有基因及其 mRNA 都被組織成三個字母的“單詞”,稱為密碼子。可以從四核苷酸字母表中構建六十四個三字母密碼子。三個密碼子充當停止訊號以停止 RNA 翻譯,這仍然留下 61 個可能的密碼子來指定僅 20 個氨基酸的蛋白質字母表,因此幾乎每個氨基酸都由多個密碼子指定。例如,所有以 GG 開頭的密碼子(GGA、GGC、GGG、GGU)都被翻譯成氨基酸甘氨酸,使這些密碼子成為同義詞。
DNA 的單字母變化,稱為點突變,因此可以將密碼子更改為指定錯誤氨基酸的密碼子(稱為錯義突變)或停止訊號(無義突變),導致最終蛋白質被截短。單鹼基變化也可能改變停止密碼子,使其編碼氨基酸(有義突變),從而導致蛋白質延長。最後一種變化是可能的:改變核苷酸但產生同義密碼子的突變。這些突變被稱為“沉默”突變。
偏倚的證據
當然,有很多例子表明前三種點突變對人類健康有重大影響。例如,編碼構成紅細胞中血紅蛋白分子的蛋白質的基因中的三種不同的點突變是導致三種不同嚴重疾病的原因。在鐮狀細胞性貧血的情況下,錯義突變將親水性氨基酸替換為疏水性氨基酸,導致蛋白質聚集在一起併產生特徵性的鐮刀狀血細胞。在紅細胞增多症疾病中,無義突變會截短一種血紅蛋白蛋白質,導致血液增稠。在地中海貧血中,有義突變將停止密碼子 (TAA) 更改為谷氨醯胺的密碼子 (CAA),從而產生更長且無功能的蛋白質。
直到 20 世紀 80 年代,科學家才意識到沉默突變也可能影響蛋白質的產生——至少在細菌和酵母中是這樣。當時的一個關鍵發現是,這些生物體的基因沒有平等地使用同義密碼子。例如,當大腸桿菌指定氨基酸天冬醯胺時,其 DNA 中出現的密碼子 AAC 比 AAT 頻繁得多。很快就清楚了這種有偏倚的密碼子使用的原因:細胞優先使用某些密碼子,因為這些選擇提高了蛋白質合成的速度或準確性。
事實證明,與這些同義密碼子相對應的 tRNA 通常在細胞內並非同樣豐富。因此,最重要的是,含有更多與相對豐富的 tRNA 匹配的密碼子的基因將被翻譯得更快,因為這些 tRNA 的較高濃度將使它們在需要時更有可能存在。在其他情況下,單一 tRNA 變體與多個同義密碼子匹配,但更容易與特定密碼子結合,因此使用該密碼子可以最大限度地提高翻譯的準確性。因此,細胞有充分的理由不平等地使用所有密碼子。正如預期的那樣,在細菌和酵母中,編碼特別豐富的蛋白質的基因表現出最大的密碼子偏倚,首選密碼子與最常見或結合力更好的 tRNA 相匹配。
後來在其他生物體(包括植物、果蠅和蠕蟲)中的觀察揭示了類似的偏倚。如此多樣的物種採用這種技術來提高蛋白質生產的效率,哺乳動物似乎也很可能也會這樣做。對哺乳動物基因的分析確實揭示了偏愛某些密碼子的趨勢。然而,簡單生物體和哺乳動物之間的相似之處被證明只是表面現象。由於原因尚不完全清楚,哺乳動物基因組被組織成大的塊,每個塊都具有獨特的傾斜核苷酸含量:一些區域富含 G 和 C 鹼基,而另一些區域富含 A 和 T。因此,位於基因組 GC 富集區域的基因往往具有許多含有這些鹼基的密碼子。因此,我們的基因確實顯示出使用某些密碼子的偏倚,但與更簡單的生物體不同,哺乳動物的模式並沒有明顯表明原因是最佳化蛋白質合成。
多年來,這些發現似乎降低了沉默突變影響人體功能的可能性。然而,從 21 世紀初開始,不同物種中相同基因的比較開始暗示,這種正統觀念是錯誤的。人們可以透過比較兩個物種中基因序列發生變異的位點和保持不變的位點來衡量兩個物種中基因序列發生變異的速率。原則上,任何不影響生物體的突變對自然選擇的力量是不可見的,自然選擇保留有益的變異。根據當時的思路,對選擇不可見的區域將包括基因內沉默突變的位點以及不指定蛋白質的基因組的 98%——非編碼 DNA。然而,當科學家開始研究基因中沉默位點的進化速度是否與非編碼區域相同,他們意外地發現了差異——這表明沉默突變畢竟可能影響生理機能。
打破沉默
最初,研究人員不知道這種突變如何在哺乳動物中干擾蛋白質的製造。然而,最近,對人類疾病的研究不僅提供了一種機制,而且提供了多種機制。致病性沉默突變會干擾蛋白質製造過程的幾個階段,從 DNA 轉錄一直到 mRNA 翻譯成蛋白質。
一個例子是沉默突變改變基因轉錄本的編輯方式。在基因轉錄成 RNA 形式後不久,該轉錄本會被修剪以去除稱為內含子的非編碼區域。就像電影剪輯師剪掉不需要的膠片一樣,細胞剪接機制需要找到編碼氨基酸的良好片段,稱為外顯子,然後將它們剪接在一起以產生基因的最終 mRNA 版本。人類基因尤其富含內含子,每個基因平均有八個長的內含子片段,因此剪接機制需要一種方法來識別每個外顯子的起點和終點。
過去幾年的研究表明,外顯子不僅指定氨基酸,它們還在其序列中包含內含子去除所需的線索。其中最主要的是外顯子剪接增強子 (ESE) 基序——大約三到八個核苷酸的短序列,位於外顯子的末端附近,併為細胞剪接機制定義外顯子。對這種基序的需求實際上可以解釋人類基因中對某些核苷酸的偏好。雖然編碼甘氨酸的密碼子 GGA 和 GGG 都可能出現在剪接增強子中,但前者密碼子充當更有效的增強子,從而導致更有效的剪接。GGA 在外顯子末端附近也相應地更常見。
為了支援在外顯子剪接增強子中保留密碼子序列的觀點,我們與我們在巴斯大學的前同事 Joanna L. Parmley 所做的研究表明,顯然充當剪接增強子的外顯子基序在其同義密碼子中的進化速度比不參與剪接的相鄰序列慢。這種緩慢的進化表明,自然選擇使增強子基序保持相對不變,因為它們的特定序列非常重要。包含這些增強子的密碼子的沉默改變,即使它們不改變氨基酸,也可能對蛋白質產生重大影響,僅僅是因為它們破壞了內含子的正確去除。
事實上,當現在在布朗大學的 William Fairbrother 和他在麻省理工學院 Christopher Burge 實驗室的同事比較外顯子的末端時,他們發現人們彼此相當相似。這些與剪接相關的區域缺乏很多變異,即使在突變會沉默的位點也是如此。原因不是突變沒有發生在我們外顯子的末端,而是當它們出現時,這些突變對蛋白質生產的破壞性太大,以至於它們往往具有破壞性並從人群中消失。
迄今為止,大約 50 種遺傳疾病已與沉默突變有關,其中許多突變似乎也干擾了內含子的去除。剪接增強子可以與基因蛋白質編碼序列的相當長度重疊,從而對沉默突變的可容忍位置施加重大限制。國際遺傳工程和生物技術中心 (的 Francisco Baralle) 最近記錄了一個剪接增強子突變可能造成的損害的驚人例子。研究人員發現,他們在囊性纖維化跨膜電導調節器 (CFTR) 基因的一個外顯子中誘導的 25% 的沉默突變破壞了剪接,因此可能導致囊性纖維化或相關疾病。
這並不是說剪接中斷是沉默突變導致疾病的唯一機制。即使內含子從 RNA 轉錄本中正確去除,mRNA 也可能無法正確摺疊。與教科書中(為簡單起見)有時描述的不同,mRNA 不僅僅是一個無結構的線性字串。就像在兩條 DNA 鏈之間形成的核苷酸對一樣,mRNA 的分離區域可以是互補的,並且會配對以建立稱為莖環的複雜摺疊結構。mRNA 摺疊的方式決定了它的穩定性,而穩定性反過來會影響核糖體翻譯它的速度以及細胞垃圾處理隨後對其的降解。
在多巴胺受體 D2 基因中,該基因編碼檢測神經遞質多巴胺存在的細胞表面受體,一種沉默突變導致 mRNA 比正常情況下更快地降解。結果,產生的編碼蛋白減少,導致認知障礙。相反,在兒茶酚-O-甲基轉移酶 (COMT) 基因中,沉默突變增加了 mRNA 摺疊的程度,可能產生過多的結構,在翻譯前可能難以解開——降低蛋白質合成。北卡羅來納大學教堂山分校的 Andrea G. Nackley 和她的同事發現,這種突變會影響疼痛耐受性;這項研究是在牙科學校完成的,也許這並不奇怪。
沉默突變影響蛋白質的另一個例子也是最直接的影響之一,它涉及一種稱為多藥耐藥性 1 的基因。該基因之所以如此命名,是因為其蛋白質產物是一種細胞泵,在癌細胞中幫助排出化療藥物,從而賦予這些細胞耐藥性。國家癌症研究所的 Chava Kimchi-Sarfaty 和她的同事發現,沉默變化導致泵蛋白錯誤摺疊,降低了細胞排出藥物的能力。由於翻譯過程和蛋白質摺疊可以同時發生,研究人員推測,沉默突變產生的較稀有的同義密碼子導致翻譯過程中出現停頓,這反過來又使蛋白質有時間採用不尋常的結構。如果發生這種停頓,確切原因尚不清楚,可以將其新增到關於基因和蛋白質工作原理的尚未解決的謎團列表中。
高效基因,有效藥物
科學家可以從最近關於沉默突變影響的發現中汲取的一個教訓是,在我們的假設中要謹慎。當沒有機制將沉默變化與蛋白質生產的改變聯絡起來時,對同義突變一定是“沉默”的信心很普遍。但鑑於上述引人注目的例子,這種立場不再站得住腳。
認識到並非沉默的突變的力量開始幫助研究人員改進基因工程方法。瞭解基因中哪些核苷酸需要保留,哪些核苷酸可能被替換,這在生物技術中具有直接應用。基因療法和使用動物或微生物工業化生產蛋白質(例如治療藥物)都依賴於設計和製造基因並將其插入細胞基因組的能力。建立有效工作的基因充滿了困難,其中包括確保新引入的轉基因被細胞啟用,從而產生足夠量的其編碼蛋白質。這就是對同義但不沉默的突變的影響的敏感性發揮作用的地方。
在人類基因中,大多數內含子似乎是可有可無的(只有一個,通常是第一個內含子,似乎是基因產生蛋白質所必需的)。這一觀察結果意味著可以透過去除內含子來使轉基因緊湊。這也意味著一些沉默突變位點可以被調整而不會產生不利影響,因為省略內含子消除了對剪接增強子的需求。從這種約束中解放出來,遺傳學家可以利用這些沉默位點用於其他目的。
華沙國際分子和細胞生物學研究所最近的一項實驗說明了如何為了人類利益而操縱沉默突變位點。Grzegorz Kudla 和他的同事獲取了三個基因,並且僅僅改變了沉默位點特定核苷酸鹼基的相對比例,然後將改變後的基因轉移到哺乳動物細胞中。令人驚訝的是,研究人員發現,與相同基因的 GC 含量低的變體相比,增加 G 和 C 含量導致基因活性和蛋白質製造效率提高了 100 倍。
新的理解還應該為理解疾病的根本原因提供資訊。許多尋找疾病潛在基因的專案都以正在進行的基因組作圖專案為中心,這些專案旨在編目人類之間的遺傳變異。透過識別患有特定疾病的個體中的所有點突變或單核苷酸多型性 (SNP),科學家現在可以定位到基因組中包含可能導致該疾病的基因變異的區域。
直到最近,此類搜尋都假設,如果基因中的多個突變與疾病的存在相關,那麼那些改變蛋白質氨基酸序列的突變一定是致病變異。事實上,與疼痛耐受性相關的COMT 基因已知有一種突變,該突變將一個氨基酸改變為另一個氨基酸,並且長期以來一直認為該變異是疼痛不耐受的唯一原因。然而,疼痛耐受性非常高或非常低的個體在那個突變位點具有相同的核苷酸,這表明他們的差異必然有其他原因。只有在闡明瞭沉默突變可能產生影響的機制後,實驗結果揭示 COMT 中的沉默突變是罪魁禍首才被接受。
某些疾病的原因很可能被錯誤地歸因於改變蛋白質的突變,而實際上是同義突變在作祟。研究人員在基因組大海撈針中尋找有害突變針時,需要牢記這種可能性。誰知道此類調查還會發現哪些額外的疾病機制?
到目前為止的發現是否意味著沉默突變經常導致疾病?也許是這樣。人們可能會認為沉默變化在智力上很有趣並且可能具有實際意義,但它們顯然不是許多疾病的原因。然而,最近對基因如何進化的研究表明,這種觀點可能過於自滿。幾年前,我們中的一位(Hurst)表明,在BRCA1 基因(與早發性乳腺癌相關)的一個片段中,齧齒動物和人類的沉默位點的進化速度都非常慢。相比之下,該基因片段中的其他序列以正常速度進化。這種差異並不意味著緩慢進化的沉默位點中的突變很少見,而是意味著攜帶這些突變的個體死亡而沒有將它們遺傳下去。後來,該片段被證明與剪接增強子的位置重合——換句話說,這是另一個例子,其中沉默突變是如此具有破壞性,以至於其攜帶者死亡。
自然選擇施加壓力以使沉默位點不發生變化的基因片段有多普遍?Hurst 和 Parmley 透過掃描基因來研究這個問題,尋找沉默位點的進化速率與改變氨基酸的位點的速率明顯不同的區域。令我們驚訝的是,我們發現含有異常緩慢進化的沉默位點的 DNA 片段相對常見。事實上,它們比編碼氨基酸進化異常迅速的區域更為普遍。一段非常高度保守的沉默突變位點平均每 10,000 到 15,000 個基因序列核苷酸出現一次。
我們估計,5% 到 10% 的人類基因包含至少一個沉默突變可能有害的區域。加州大學聖克魯斯分校的 Peter Schattner 和 Mark Diekhans 進行了類似的分析,尋找基因中具有異常超保守沉默位點的大區域。他們估計,在他們檢查的近 12,000 個基因中,大約有 1,600 個這樣的區塊,這與我們的估計大致相符。然而,這兩個估計值都可能偏低,真實數字很可能要大得多。如果這些保守位點指示沉默突變可能導致疾病的位置,正如看起來很可能的那樣,那麼忽略它們將不可避免地導致疾病相關突變的錯誤識別。
認識到自然選擇確實注意到並非沉默的突變與科學家們意識到基因製造蛋白質的過程比以前想象的要複雜得多和細緻得多是齊頭並進的。基因進化方式和它們的工作方式也以十年前幾乎無法理解的程度緊密耦合。對這兩個過程的進一步研究將繼續闡明基因組工作原理的非凡複雜性。例如,DNA 不僅僅是一個線性分子,而是纏繞成線圈,必須解開才能進行轉錄。這個過程的控制是否也在沉默位點上留下指紋?同樣,稀有密碼子的執行比它們應該的更常見,但它們在做什麼以及為什麼?
這些和相關問題的答案不僅可以更好地理解蛋白質的製造,還可以為治癒疾病提供見解。
有偏倚的疫苗
操縱同義突變位點使科學家能夠設計加速蛋白質製造的基因,但相同的技術也可用於減慢蛋白質製造。石溪大學的 Steffen Mueller 和他的同事最近採用了這種方法來設計一種更安全的脊髓灰質炎疫苗。活病毒是最好的疫苗,因為它們會在接受者中引起強烈的免疫反應,但活疫苗可以繁殖和突變,可能導致疾病。Mueller 的小組利用微生物偏愛使用某些密碼子來最大限度地提高蛋白質生產效率的特性,設計了一種脊髓灰質炎病毒,該病毒在編碼病毒外殼的序列中替換了較稀有、效率較低的密碼子。由此產生的病毒能夠複製自身,儘管速度較慢。在研究人員將工程病毒接種到小鼠體內後,當動物隨後暴露於野生脊髓灰質炎病毒時,它們受到了感染保護。這種利用密碼子偏倚來建立活的但減毒的疫苗的技術也可以應用於其他病原體,以生產有效但更安全的疫苗。
注意:本文最初印刷時的標題為“沉默突變的代價”。