“垃圾”DNA 蘊藏著常見疾病的線索

隨著人類基因組的新註釋,研究人員發現,基因之間的大部分程式碼正在控制著生命和健康的關鍵功能

人類基因組草圖於2000年釋出時,研究人員認為他們已經獲得了人體秘密的解碼環。他們擁有30億個鹼基對(A、T、C和G)的程式碼以及21,000個蛋白質編碼基因,希望能夠找到生命(包括疾病和健康)的遺傳支架

但自那以來的12年裡,很少有疾病(幾乎都是非常罕見的疾病)被明確地與基因本身的變化聯絡起來。而且,尋找更常見疾病(如肺或自閉症)遺傳基礎的大型全基因組研究,都指向了蛋白質產生基因之間的基因組的深處——這些區域通常被認為包含“垃圾”DNA,而不是已知基因的一部分。

一個由數百名科學家組成的國際聯盟現在已經破譯了這種垃圾DNA的奇怪語言的大部分,並發現它根本不是垃圾。相反,它包含著調節我們基因的重要訊號,決定著疾病風險、身高以及許多其他複雜的方面,這些方面使我們每個人都與眾不同。這些發現發表在9月5日線上發表於《自然》雜誌和其他期刊上的30篇相關論文中,並在該聯盟的網站上進行了描述。(《大眾科學》是自然出版集團的一部分。)

該小組名為DNA元素百科全書(ENCODE),其重點不僅在於理解基因組的元素,還在於理解它們如何協同工作。“我們生物學的複雜性不在於我們基因的數量,而在於調節開關,”美國國立人類基因組研究所所長兼ENCODE專案合作者埃裡克·格林在9月5日的新聞釋出會上表示。透過1600多個獨立的實驗,對140多種細胞型別進行分析,以及大量的資料分析,該小組發現了大約400萬個所謂的開關,現在可以為整個基因組的80%以上分配功能。相比之下,基因組中負責研究人員一直依賴的蛋白質編碼基因來尋找疾病和特徵的基因組只佔大約2%。 “基因組計劃是關於建立構成藍圖的字母集,”格林說,“當我們最終將藍圖拼湊起來時,我們意識到我們實際上只能理解其中的一小部分。”


關於支援科學新聞

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保有關當今塑造我們世界的發現和想法的有影響力的故事的未來。


這些新編目的開關不僅啟用和停用基因,還控制著每個蛋白質的產生量以及產生時間。它們參與表觀遺傳變化,例如DNA甲基化,它與心血管疾病和其他疾病有關。新資料有望提高我們對許多可能具有相似遺傳基礎的常見疾病的理解。華盛頓大學醫學院基因組科學副教授兼ENCODE合作者約翰·斯塔馬託亞諾普洛斯在簡報中說,全基因組關聯研究(GWAS)在識別常見疾病的特定基因方面不斷失敗。“令人沮喪的是,這些研究中約有95%的資訊都指向了不產生蛋白質的基因組區域,”他說。但是,現在有了ENCODE資料,他們可以開始破譯這些疾病內部和之間可能常見的遺傳開關和功能。“我們現在正在探索疾病之間以前隱藏的聯絡,這可能解釋相似的臨床[症狀],”他指出。

這些新發現是免費提供的,但要將其應用於批准的療法可能還需要一段時間。“製藥行業在很大程度上放棄了基因組,”斯塔馬託亞諾普洛斯說,“我認為這將極大地重振基因組的效用。”然而,這些額外的遺傳元素已經在用於篩查和檢測疾病(如乳腺癌、前列腺癌和自身免疫性疾病)方面發揮作用,阿拉巴馬州哈德森阿爾法生物技術研究所所長理查德·邁爾斯在簡報中指出。

該小組有資金繼續他們的工作,並且預計未來的發現不會放緩。“我們的藍圖非常複雜,我們需要長期致力於理解它,”格林說。與12年前釋出的人類基因組草圖以及過去幾年釋出的ENCODE專案的初步發現相比,“我們現在可以提出的問題更加複雜了,”格林說。並且,希望這些更好的問題將帶來更令人滿意和在醫學上有用的答案

© .