本文發表在《大眾科學》的前部落格網路中,反映了作者的觀點,不一定代表《大眾科學》的觀點
參與人類基因組計劃的政府和機構聯盟應該致力於完成已完成的基因組。我們最近的實驗表明,最後這些部分可能包含對我們的健康重要的基因和其他元素。1
2003年4月,人類基因組被宣佈完成,但仔細閱讀會發現,實際的說法是基因組“在幾乎所有功能方面都是完整的”或“儘可能地完整”。2 據估計,這意味著完成了 99%,自 2003 年以來的重點是獲取更多基因組,而不是完成我們最後 1% 的基因組。但是,如果這最後 1% 是“功能性的”,並且我們還遺漏了估計的 20,000 到 25,000 個基因中的 1%3,或者 200 多個基因呢?完成基因組最重要的原因在於,任何這些“缺失”的基因都不會被研究。
最後 1% 沒有完成的原因是因為它真的很難。它主要由重複序列組成,比如 CAG-CAG-CAG-CAG-CAG-CAG...,這些序列會持續數百萬個 DNA 字母。這使技術和軟體感到困惑,而我們已經克服了這一點。最後 1% 很重要的原因是,我們發現,在所有那些困難的重複部分之間,存在著未被發現的基因,其中一些我們現在已經找到了。所有含有基因的序列都會進入一個叫做“參考基因組”的東西,4 這就是每位科學家用來研究和嘗試尋找疾病或性狀的遺傳因素的東西。如果一個基因不在參考基因組中,它就永遠不會被研究。因此,我們的發現將使許多其他人能夠研究它們。還有一些人認識到真正完成人類基因組的必要性,有些人已經成功地將大型克隆定位(對映)到高度重複的區域。我們的方法繞過了對映步驟的需要,直接進入下一代序列。
關於支援科學新聞
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保關於當今塑造我們世界的發現和想法的有影響力的故事的未來。
關於自然有一點,它是高效的,所以這些重複區域的存在是有原因的(即使我們還不知道它是什麼),而且這些基因也有其功能(同樣,即使我們還不知道該功能是什麼,或者當基因被破壞時會發生什麼)。關於這剩餘部分的重要性仍然存在爭議,有時被稱為“垃圾 DNA”或“暗物質 DNA”。但我認為,目前盛行的科學觀點是,基因組的其餘部分,即基因間(基因之間)區域很重要,並且包含其他重要的東西,但我們尚未弄清楚有關這些區域的太多資訊。
基因組中這些缺失的大部分片段可能位於我們染色體的中心和末端,稱為著絲粒和端粒。5,6 這些區域在 DNA 複製(細胞分裂)和基因保護中發揮著重要作用。並且已知它們是某些疾病的一部分。這些端粒主要由重複序列組成,科學家們已經注意到,隨著細胞老化或在某些癌症中,這些序列會縮短。因此,許多科學家認為它們的存在是為了起到緩衝作用,這樣,隨著年齡的增長而發生的侵蝕不會破壞任何基因。首先,如果其中存在基因(我們現在已經發現了),它們可能會在衰老(和老年疾病)中發揮作用。其次,迄今為止,所有小組都研究了一種 6 個字母長的重複序列 (GGGTTA),但是,根據我們的實驗,我們發現了 5 個字母長的序列(AATGG 和 GTGGA),其丰度比經常研究的 6 個字母序列高 150 倍。因此,我們認為,現在我們可以檢視正確的位置,或許可以更好地解釋對衰老和老年疾病(如癌症)的理解... 同樣,在“發現”這些缺失的部分之前,無法對它們進行研究。
現在是時候重新致力於完成基因組了。測序技術已經變得更好,並且像我們的方法這樣的“棘手”實驗方法可以提供幫助。如果其中一個未發現的基因真的很重要,但沒有人關注它怎麼辦?我們越早真正完成人類基因組,就越早能夠真正地利用它,為了理解和健康。
參考文獻
基因組遺留物:識別人類基因組中的新型微衛星、過度代表性基序和功能元件。Natalie C. Fonville、Karthik Raja Velmurugan、Hongseok Tae、Zalman Vaksman、Lauren J. McIver 和 Harold R. Garner,《科學報告》6,文章編號:27722 (2016),doi:10.1038/srep27722
https://www.genome.gov/11006943/human-genome-project-completion-frequently-asked-questions/
https://en.wikipedia.org/wiki/Reference_genome
https://en.wikipedia.org/wiki/Telomere