關於支援科學新聞報道
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道: 訂閱。透過購買訂閱,您正在幫助確保有關當今塑造我們世界的發現和想法的具有影響力的故事的未來。
在人類進化過程中,增強疾病抵抗力或提高特定氣候適應性的基因突變被正向選擇。但是,目前用於尋找這些有益突變或變異的統計方法只能鎖定跨越多個基因的區域,這些區域也可能涵蓋各種其他功能。
在人類基因組的這些廣闊區域內,還有許多未被選擇或中性的變異,它們也因與被選擇的變異在同一條染色體上而被優先遺傳。“基本上,當選擇發生時,會牽連出一大堆[突變],然後你試圖找到哪個是驅動因素——也就是那根針,”哈佛大學有機體和進化生物學系的進化遺傳學家Pardis Sabeti說。
為了縮小正向選擇的罪魁禍首,Sabeti和她的研究團隊開發了一種方法,將不同選擇變異特異性的統計方法組合成一個強大的工具。使用該複合工具,該小組分析了來自不同染色體的數百千鹼基(或數十萬個核苷酸)區域的突變。這些突變發生在基因內部或基因組中不編碼基因的部分。儘管該團隊針對過去3萬年中發生的選擇優化了他們的方法,但Sabeti表示,經過一些調整,該方法可以追溯到人類種群開始遷出非洲並在5萬至7萬年前彼此分化的時間點。該團隊首次使用複合方法的研究於1月7日發表在《科學》雜誌上。
使用這項技術,科學家可以預測基因組中的一個區域,該區域窄至單個基因,而不是多個基因,這很可能已被正向選擇。例如,他們發現了一個與眼睛顏色或皮膚色素沉著有關的單個基因,該基因很可能從包含五個基因的區域中被選擇出來。
“這種方法可以讓你更精確地說出哪些型別的基因被選中了,我認為這非常強大,”西雅圖華盛頓大學的進化生物學家Joshua Akey說,他沒有參與Sabeti小組的研究。
在建立複合方法之前,不同的進化遺傳學家小組一直在使用可以檢測由正向選擇產生的3種不同遺傳模式之一的方法。儘管該領域已經有關於結合不同方法以嘗試提高信噪比(或針與草堆)的傳言,但Sabeti表示,實際上沒有人測試過這種可能性。據Akey稱,“他們所做的聰明之處在於,‘我們可以使用這些不同測試捕獲的略有不同的資訊’。”
Sabeti自己開發的第一項測試擅長尋找已經經歷過正向選擇的基因組大區域。由於姐妹染色體在基因組區域中彼此交換遺傳資訊的速率是規則的,因此可以估計該區域與其祖先序列相比的年齡。
但是,當一個區域獲得被選擇的變異時,該變異通常會迅速在整個人群中傳播,並帶動染色體上相鄰的中性變異一起傳播。這種快速傳播的原因是,與沒有被選擇的變異的人相比,具有被選擇的變異的人更有可能繁殖並將有益的突變傳遞給下一代。當研究人員發現人群中共享的變異島時,這表明其中一個或多個變異賦予了優勢。
由於這種方法使科學家們獲得的區域可能包含多達一百萬個核苷酸和數十個基因,因此Sabeti的小組納入了其他方法,這些方法可以定位更精細的正向選擇特徵。研究人員優化了一種方法,該方法檢查這些島嶼內的單個突變,試圖確定高流行率的變異。與掃描島嶼相比,此過程的優勢在於它能夠對每個變異進行評分,以確定其被選擇而不是中性的可能性。
科學家們納入其複合方法的第三種策略考慮了正在分析的基因組的人口背景。由於生活在不同環境中的人群面臨著不同的選擇壓力,因此,當比較不同人群時,負責賦予選擇優勢的變異可能會顯現出來。
為了測試複合方法的能力,Sabeti的團隊對178個基因組區域進行了新方法測試。該序列來自HapMap 2專案,這是一個國際專案,旨在對歐洲、東亞和西非後裔的個體基因組區域進行測序,重點關注這些群體之間差異的核苷酸。到目前為止,該專案已對270人的300萬個核苷酸進行了測序。
複合方法的解析度比它使用的任何測試高100倍。換句話說,單個測試可能會預測在1000個變異的總區域內某處存在被選擇的變異,而組合策略將可能性縮小到10個變異的區域。
與Sabeti和其他研究人員一起進行這項研究的Sharon Grossman說,她對該方法比單項測試強大得多感到驚訝。“很多人都認為它行不通,因為他們認為如果你透過一項[測試]獲得高分,那麼你就會透過所有測試獲得高分,”她補充說。儘管不同的測試都可以給被選擇的變異打高分,但它們在給中性變異打低分的能力上有所不同。因此,Grossman說,新方法的假陽性率很低。
除了確定顯示出正向選擇跡象的色素沉著基因外,研究人員還發現,他們研究的東亞後裔中與聽力和視覺感知相關的基因更為頻繁。
但是,Sabeti最興奮的基因被稱為large,它與非洲的一個亞種群對拉沙熱病毒的抵抗力有關。科學家們發現,某些版本的所謂的大基因可以保護擁有它的奈及利亞人免受感染,否則這種感染將像埃博拉病毒一樣致命。藉助她使用的新方法來縮小基因內的變異範圍,Sabeti渴望嘗試找出大型基因的哪些突變可以預防拉沙熱。
透過複合方法揭示的另一個發現是,大約一半的預測選擇變異不在編碼蛋白質的基因區域。“最近,在全基因組關聯研究中,出現了一次徹底的改革,其中許多最重要的功能變化是調節性的,或者是在基因的非蛋白質編碼區域中,”Sabeti說。
隨著遺傳學家從更多個體收集序列資訊,識別所選變異以及它們編碼的性狀或它們調節的基因的潛力可能很快就會爆發。儘管Sabeti的研究僅分析了來自270個個體的300萬個核苷酸,但透過千人基因組計劃正在進行工作,以對1000人的整個基因組進行測序。
北卡羅來納大學教堂山分校的遺傳學家James Evans沒有參與當前的研究,他說,隨著下一代測序技術的出現,獲得資料不再是障礙。“我們很快就會獲得來自全球各地人類的大量序列資料,而分析已成為瓶頸。這就是為什麼這種研究如此重要和及時,”他說。