關於內含子的功能,基因中的非編碼序列,我們知道些什麼?

這個問題涉及到許多生物 DNA 中遺傳資訊組織方式的一個奇特特徵。構成 DNA 的鹼基序列編碼了相應的氨基酸序列,氨基酸序列構成了蛋白質。分子生物學家最初假設,在一個基因中,所有編碼蛋白質的 DNA 都是連續的,當他們首次研究原核生物(細菌和其他簡單細胞)的基因時,他們發現了這一點。然而,當研究人員觀察更復雜的(真核)細胞時,他們發現編碼 DNA 通常是不連續的:編碼 DNA 的片段(稱為外顯子)與長段的非編碼 DNA(稱為內含子)交錯排列。DNA 轉錄成 RNA 鏈後——但在 RNA 翻譯成蛋白質之前——內含子會被剪下掉。雖然內含子有時被粗略地稱為“垃圾 DNA”,但它們如此普遍並且在進化過程中被保留下來,這一事實讓許多研究人員相信它們具有某種功能。

西弗吉尼亞大學生物系助理教授 Ashok Bidwai 詳細闡述道

“人們普遍認為,內含子是遺傳序列的殘餘,這些遺傳序列曾經充當 DNA 片段之間的間隔,這些 DNA 片段編碼特定的、相對簡單的蛋白質。在複雜蛋白質的進化過程中,遺傳密碼的區域(稱為結構域)可能被改組並組合在一起,產生新的序列,這些序列編碼具有新功能的新的蛋白質結構。該假設基於以下觀察:內含子在基因中的相對位置在生物體中基本保持不變,這些生物體包括果蠅(果蠅)、秀麗隱杆線蟲(一種廣泛研究的線蟲)、小鼠和人類。哈佛大學的 Walter Gilbert 詳細闡述了這一假設的許多細節。”


支援科學新聞報道

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保有關塑造我們當今世界的發現和想法的具有影響力的故事的未來。


“此外,一些研究人員提出,內含子充當一種機制,選擇在生物體發育早期(而不是晚期)表達的基因。然而,這個想法並非基於廣泛的實驗,因此其合理性尚不確定。”

在哈佛大學 Walter Gilbert 實驗室工作的 Sandro J. de Souza 擴充套件了關於內含子的主流假設

“關於內含子功能的問題在 1977 年它們被發現後立即出現。內含子的作用是什麼?它們為什麼存在於我們的基因中?將近 20 年過去了,我們仍然沒有明確的答案,即使一些 DNA 資料庫現在包含大約 500 兆鹼基的序列——也就是說,代表我們基因組中 5 億個化學字母的遺傳密碼字串。”

“首先,讓我們從一些分類開始。至少有五種不同型別的內含子。其中一些是核酶,即具有催化活性的 RNA 分子,這意味著它們促進某些化學反應;其中一些核酶能夠執行一種反應,在反應中它們將自身從原始轉錄本中剪切出來。最常見的內含子型別稱為剪接體或核內含子;該名稱來自細胞機制,稱為剪接體,它負責剪接並確保內含子中的遺傳序列不被翻譯成垃圾蛋白質。這種型別的內含子是在人類核基因中發現的。”

“一般來說,核內含子廣泛存在於複雜真核生物或高等生物中。簡單的原核生物和真核生物(如真菌和原生動物)缺乏它們。在複雜的多細胞生物(如植物和脊椎動物)中,內含子比外顯子(基因組的活性編碼部分)長約 10 倍。內含子的序列和長度在進化過程中迅速變化。”

“內含子有時確實具有可識別的功能。科學家們已經發現了“功能性核內含子”的明確例子,這些內含子可以容納對內含子所在基因的表達重要的序列。然而,這種功能並非內含子的一般特徵,因為一些缺乏內含子的基因也能正常表達(例如組蛋白和嗅覺受體基因)。還有一些案例中,內含子包含小核 RNA 的基因,小核 RNA 對於信使 RNA 的翻譯非常重要,信使 RNA 是 DNA 和蛋白質之間的中間體。核內含子在稱為選擇性剪接的過程中也很重要,選擇性剪接可以從單個基因產生多種型別的信使 RNA。儘管這些例子證明了內含子的建設性作用,但它們無法解釋為什麼內含子在我們的基因中如此普遍。”

“1978 年,哈佛大學的 Walter Gilbert 對內含子的性質表達了不同的看法(在他創造“外顯子”和“內含子”這兩個術語的同一份報告中)。他認為,內含子可以透過促進外顯子之間的遺傳重組來加速進化。這個過程(他稱之為“外顯子改組”)將直接與新基因的形成相關。從這個角度來看,內含子具有深刻的目的。它們充當形成外顯子新組合的重組熱點。換句話說,它們存在於我們的基因中,是因為它們在進化過程中被用作組裝新基因的更快途徑。在過去的 10 年中,外顯子改組的想法已得到來自各種實驗方法的資料支援。”

“未來十年將完成多個基因組專案。預計它們將產生關於內含子序列的大量資訊。新資料應該可以解決我們關於內含子功能的大部分基本問題。”

© .