一項旨在詳盡編目人類基因組所有功能的龐大專案的首批結果揭示了基因間隙中存在著活躍的活動。一個國際研究聯盟篩選了1%的基因組,尋找被細胞複製或有助於控制基因活動的DNA片段。結果表明,大部分DNA都被複製成RNA分子,包括基因之間的長片段,並且基因之間的重疊和相互作用比研究人員之前認為的要多得多。
“我們都懷疑這些區域[基因之間]正在發生一些有趣的事情,果然如此,”該專案計算機分析團隊的成員、英國劍橋附近歐洲生物資訊學研究所的生物資訊學家伊萬·伯尼說。
儘管研究人員尚不清楚這些發現的生物學意義,但他們表示,對基因組進行完整編目可能有助於他們瞭解基因變異如何影響罹患癌症等疾病的風險,以及人類如何從單細胞胚胎成長為成年人。該專案的下一階段將於今年晚些時候開始,屆時將嘗試對整個基因組進行清點。
關於支援科學新聞報道
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。 透過購買訂閱,您將有助於確保關於塑造我們當今世界的新發現和想法的具有影響力的故事的未來。
基因組僅由四種不同的核苷酸鹼基或DNA亞單位組成,並以特定的順序排列。2001年人類基因組的釋出揭示了它的序列,但其意義仍然是個謎。特別是,基因僅佔基因組30億個鹼基的1.2%。曾經被視為“垃圾DNA”的這些所謂非編碼區域,研究人員發現其中一些在哺乳動物中是共享的,這表明它們發揮著重要作用。
為了幫助揭示這些功能並識別其他重要序列,35個研究小組於2003年聯合建立了DNA元件百科全書(ENCODE)專案。該聯盟選擇了基因密度從高到低以及小鼠和人類之間的相似性從高到低的44個獨立的基因組片段。
就像尋寶者用金屬探測器梳理廣闊的沙灘一樣,ENCODE研究人員以多種方式篩選了他們的基因組區域,結果與描述一起發表在今天線上釋出的《自然》雜誌論文和《基因組研究》的特刊中。
該專案的一個主要部分是識別細胞複製或轉錄成RNA分子的序列。細胞從基因複製的RNA製造蛋白質,但一些RNA本身也發揮作用。此外,一些研究發現,從果蠅和蠕蟲到人類的物種都會從非編碼DNA複製大量的RNA,但沒有明顯的目的。儘管如此,耶魯大學的生物資訊學家和聯盟成員馬克·格斯坦因說:“在ENCODE之前,我認為很多人都對基因間活動的真實性持懷疑態度。”
儘管基因僅佔ENCODE序列的3%,但該聯盟發現93%的序列被轉錄。研究人員報告說,一些轉錄本來自非編碼DNA,但那些與399個ENCODE基因匹配的轉錄本彼此之間廣泛重疊。
分子生物學家和聯盟成員、位於加利福尼亞州聖克拉拉的基因組技術公司Affymetrix的湯姆·金格拉斯表示,65%的基因轉錄本都包含了來自基因外部相對較遠甚至來自其他一兩個基因的DNA片段。研究人員知道,細胞將單個基因切成稱為外顯子的較短片段,然後將它們混合搭配成一個轉錄本,用於建立蛋白質。金格拉斯表示,ENCODE的發現證實了最近的報告,即人類和果蠅有時會組合來自兩個不同基因的外顯子。
根據轉錄序列,研究人員在基因內部或之間識別出1437個新的啟動子——轉錄開始的短DNA序列,這還不包括他們已知的1730個啟動子。伯尼說,每個基因幾乎有十個啟動子。他補充說,重疊每個基因的大量轉錄本表明,“基因”這個詞在細胞核內部(轉錄發生的地方)和外部(成品蛋白質去的地方)的含義應該有所不同。
專案成員還編目了標記DNA區域的序列,這些區域的DNA從維持染色體形狀的圓形組蛋白中解開,從而允許細胞的轉錄機制啟用這些區域的基因。伯尼說,他們發現了一些可能解開的區域,這些區域遠離啟動子,因此可能發揮著其他作用。
該聯盟發現,5%的研究序列在23種哺乳動物中被儲存下來,這表明它發揮的作用足夠重要,以至於進化過程可以儲存下來,而物種也隨之進化。但在所有被確定為可能重要的新ENCODE序列中,只有一半屬於保守組。
伯尼說,這些不保守的序列可能是“旁觀者”——基因組其他功能的結果——既不幫助也不傷害細胞,並且可能為過去的進化提供了素材。
安大略省圭爾夫大學的基因組研究員T·瑞安·格雷戈裡(他不是該聯盟的成員)說,它們也可能只是維持有用的DNA結構或DNA片段之間的間隔,而不管其特定的序列如何。
“目前,生物學見解主要是漸進式的,”位於休斯頓的貝勒醫學院的基因組生物學家喬治·韋恩斯托克說,他表示這對於這樣的試點研究來說是預料之中的。“這是一個像基因組專案一樣的‘社群資源’專案,它向社群提供了大量新資料,然後社群可以深入研究並從中挖掘發現。”
格雷戈裡說,結果雖然仍然神秘,但確實暗示了新的功能和一個更復雜的基因組。“這項研究向我們展示了我們距離全面瞭解人類基因組還有多遠。”