關於支援科學新聞
如果您喜歡這篇文章,請考慮訂閱我們的獲獎新聞,以支援我們的工作 訂閱。透過購買訂閱,您將有助於確保關於當今世界塑造的發現和想法的有影響力的故事的未來。
如果你問美國國家人類基因組研究所(NHGRI)的科學家,人類基因組計劃何時結束,他們會告訴你是在2003年完成的。然而,一項新的研究表明,由多人基因程式碼片段拼湊而成的綜合參考基因組絕對是一項正在進行中的工作。
完成的基因組本應作為典型人類的遺傳構成模型,研究人員可以將其作為參考,來檢測患有某些疾病的人的遺傳缺陷。但是,上週發表在《自然》雜誌上的新研究表明,當前的模型可能存在缺陷,並且可能實際上存在尚未發現的基因缺失。
對八個人的基因變異研究發現,整個基因組中有250多個區域,研究人員認為這些區域可能包含數百個新基因。該研究的合著者、西雅圖華盛頓大學基因組科學副教授埃文·E·艾希勒說,研究還確定,參考基因組可能完全錯誤,或者包含罕見的等位基因(基因的版本)。
未參與這項研究的耶魯大學生物學家邁克爾·斯奈德說,“參考基因組具有罕見的等位基因意味著它沒有準確地呈現大多數人,而大多數人是這樣認為參考基因組的。”
艾希勒認為,從這八個基因組以及他計劃分析的其他17個基因組中收集到的發現,可以幫助填補參考基因組中的空白,這將使該序列在研究心臟病、糖尿病和精神分裂症等複雜遺傳疾病時更有幫助。艾希勒說:“俗話說,‘關鍵在於序列,笨蛋。’一旦你獲得高質量的序列,你就可以進行關聯研究和疾病研究。”
艾希勒和他的團隊著手透過比較幾個人的程式碼來確定基因組中發生結構變化的區域。這些變異會影響遺傳密碼中的數千到數百萬個字母或核苷酸(DNA分子)。人類基因組包含30億個字母。這些改變可以採取所謂的複製數變異(其中幾個基因被刪除或複製,導致一個人攜帶的基因複製數發生變化,而不是來自每個父母的一個複製的正常情況)或倒位,其中程式碼的片段被反轉。這些突變可能是由於在製造兒童的基因組(透過將父母的程式碼剪下和貼上在一起)時或修復DNA損傷時出錯引起的,DNA損傷通常是由紫外線和吸入煙霧等環境因素引起的。
研究人員從八個人的血液中提取了DNA樣本:四名非洲人、兩名亞洲人和兩名歐洲人。他們隨機地將每個人的程式碼分解成一百萬個片段,然後嘗試將片段的末端與參考基因組上的區域進行匹配。如果他們找不到匹配項,則團隊將不匹配的片段指定為結構變化的位點。
研究人員總共識別出1,695個結構變異例項,其中800個是先前未報告的。受這些突變影響的區域中有50%出現在一個以上的研究人員身上。在參考基因組中發現缺失的525個區域中,有40%是由於複製數變異造成的,這意味著可能有一批尚未發現的基因隱藏在其中。
紐約長島冷泉港實驗室的遺傳學家喬納森·塞巴特說:“我幾乎可以肯定他發現了新的基因。我們從未見過參考序列中基因的複製數為零的[位置]。”
艾希勒說,他的團隊目前正在對志願者基因組中包含缺失資訊的片段進行測序。他說:“很明顯,那裡有一些看起來可能是基因的東西。”
他指出,我們基因組中的許多結構變異發生在程式碼的400個不穩定區域中。他說:“這些變異中的許多都偏向於特定的區域,這些區域包括對適應至關重要的基因。這些基因在人類內部已經發生了非常根本的變化,或者是人類之外找不到的[相對]新基因。”他稱這些區域為“進化熔爐”,其中新的核苷酸組合被嘗試過,但大多數被丟棄,只有在“極少數”情況下,它們創造了有利的特徵,並且“創造了一個新的基因”。
一旦這些結構變異被描述為缺失、重複或倒位,它們就可以新增到其他工作中,如國際單體型圖計劃,這是一項旨在對不同種族的人之間基因內僅涉及單個核苷酸的突變進行編目的嘗試。今年早些時候,包括NHGRI在內的一個國際聯盟宣佈了一項計劃,對1,000個基因組進行測序,這將有助於完善參考基因組中的資料。
艾希勒說,如果可以修改參考基因組以表示最常見的基因集(並且可以對大小變異進行編目),科學家們將能夠快速查明患有特定疾病(如糖尿病)的人的等位基因,並將其與參考基因組進行比較,以確定它是“正常”還是有缺陷的。他說:“透過正確地描述正常基因組,我們將能夠非常容易地識別出導致疾病的變異。”