利用大資料破解自閉症

研究人員在資料集中搜尋自閉症的線索——在 20,000 人的基因 草堆  中尋找 針

自從 邁克爾·威格勒 在自閉症遺傳學方面取得突破性發現以來,已經過去 10 年了——可以說,這一發現開創了我們今天所知的這個領域。

2007 年 4 月,威格勒和當時的同事 喬納森·塞巴特報告稱,“從頭”突變——那些自發產生而不是遺傳的突變——在自閉症患者中比在普通人中更常見。他們注意到的突變形式是“複製數變異”(CNV),即 DNA 長片段的缺失或重複。CNV 在癌症中頻繁出現,這是威格勒早期工作的重點。但他發現 CNV 也與自閉症有關,這讓該領域的人們感到驚訝。“遺傳學在基於傳播和遺傳的其他努力中屢屢受挫,”威格勒說。“在那個真空期,這個新想法很快就被接受了。”

這一發現迅速促成了進一步的進展。三個科學家團隊(包括威格勒領導的一個團隊)主要關注從頭突變,開始尋找導致自閉症的基因。他們的方法很有效率:他們沒有檢視整個基因組,而是搜尋了編碼蛋白質的 2% 部分,稱為 外顯子組。他們專門研究了單純型家庭,這些家庭只有一個自閉症兒童,父母和兄弟姐妹均未受影響。其前提是,比較家庭成員的外顯子組可能會暴露自閉症兒童的從頭突變。這種方法 取得了巨大成功:根據來自 600 多個家庭的資料,這些團隊共同預測有數百個自閉症基因。他們確定了六個主要候選基因。當時確定的一些基因—— CHD8、 DYRK1A、 SCN2A ——迅速成為熱門研究領域。


支援科學新聞報道

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保有關當今塑造我們世界的發現和想法的有影響力的故事的未來。


2014 年,強有力的候選基因數量躍升。在兩項分析超過 20,000 人序列的大規模研究中,研究人員高置信度地將 50 個基因與自閉症聯絡起來。威格勒的團隊研究了單純型家庭,並在 27 個基因中發現了罕見的從頭 突變。在第二項研究中,研究人員篩選了遺傳和 從頭 突變,並牽涉到 33 個基因。這兩項研究共同確定了 10 個基因。

兩年前,自閉症基因候選名單再次激增。研究人員運用統計魔力,結合了來自 自閉症基因組計劃從頭 和遺傳突變資料以及 CNV 資料, 精確定位了 65 個基因和 6 個 CNV,認為它們是自閉症的關鍵。他們還確定了 28 個基因,他們幾乎可以肯定地說這些基因是“自閉症基因”。

加州大學舊金山分校精神病學助理教授、該研究的共同負責人 斯蒂芬·桑德斯說:“長期以來,我們一直在說,如果我們能找到這些基因,我們就能夠真正取得一些進展。”“突然,你得到了這份包含 65 個以上基因的列表,我們知道這些基因在自閉症中起著致病作用,作為前進的基礎,這真是太棒了。”

這些進展毫無疑問地確立了自閉症深深紮根於生物學。“我們越來越消除自閉症是一種帶有汙名的精神疾病的觀念,我認為這對整個精神病學來說都是如此,”桑德斯說。“這些是遺傳疾病;這是生物學的結果,是可以理解的,並且可以在其中取得進展。”

然而,這僅僅是個開始。隨著科學家們進入自閉症遺傳學的下一個篇章,他們正在研究如何利用他們學到的知識,使用更好的測序工具和統計方法、更大的資料集和更強大的模型。例如,他們正在尋找常見變異——在 1% 以上的人口中發現的變異,但當大量遺傳時,可能會導致自閉症。他們也開始將目光投向外顯子組之外,投向他們迄今為止在很大程度上忽視的基因組的剩餘 98%。

加州大學洛杉磯分校人類遺傳學教授 丹尼爾·格什溫德說:“大多數遺傳學進展都屬於大效應量 從頭變異的範疇,這只是難題的一部分。”這是一個重要的部分,但仍然無法解釋為什麼自閉症在家庭中聚集,例如,或者為什麼自閉症患者的近親經常具有該病症的一些特徵。

共同核心

那麼,科學家們已經揭示了多少自閉症的遺傳結構?目前的估計表明,罕見突變,無論是從頭 突變還是遺傳突變,在 10% 到 30% 的情況下會導致該病症。在最近的一系列發現之前,已知有遺傳原因的自閉症患者比例僅為 2% 到 3%——其中大部分來自罕見的相關遺傳綜合徵,例如脆性 X 綜合徵 和結節性硬化症複合體,這些綜合徵源於單個已知基因的突變。這些綜合徵通常涉及自閉症的一些核心特徵,以及它們自身的一系列特徵性特徵和智力障礙。

哈佛大學醫學副教授 馬克·戴利說:“在兩代人之前,至少 75% 的自閉症與嚴重的智力障礙和其他神經發育異常並存。”“這也是一種罕見得多的診斷。”

戴利說,近幾十年來診斷數量的大幅增加“絕大多數”反映了光譜中較輕的病例,這帶來了新的挑戰。“自閉症的遺傳學讓我們與這樣一個事實作鬥爭,即罕見突變,尤其是這些自發產生的突變,是最強的風險因素,”他說。“但與此同時,現在大多數病例都沒有這些高影響風險因素。”

相反,這些病例中的大部分風險可能來自常見變異,這些變異本身的影響很小,但可以累積起來增加總體風險。研究人員試圖利用全基因組關聯研究 (GWAS) 來識別與自閉症相關的常見變異,GWAS 將患有和未患有某種疾病的人的基因組進行比較,以找到稱為單核苷酸多型性的 DNA 單字母交換差異。

由於常見變異的個體影響很小,因此很難找到它們,但多項研究表明,它們 在自閉症風險中起著重要作用。例如,在 2014 年的一項研究中,研究人員使用統計工具,根據患有自閉症的無關人員共享的常見變異量來估計自閉症的遺傳力。他們將該方法應用於來自瑞典國家健康登記處 3000 多人的資料。他們的計算表明, 常見變異佔普通人群自閉症風險的 49%;罕見變異(從頭 和遺傳各佔一半)解釋了 6%。一些科學家對這些數字提出異議,但很明顯,常見變異、罕見遺傳變異和自發突變都在自閉症中發揮作用。

威格勒說,他對使用 GWAS 研究自閉症持懷疑態度,正是因為它們側重於常見變異。“大多數會導致痛苦和折磨並需要昂貴治療的疾病,如果它們是遺傳性的,則是由不會在人群中長期存在的罕見變異引起的,”他說。

常見變異在光譜中較輕的一端可能比在嚴重受影響的人群中更相關。“那些具有從頭 突變的人,總的來說,往往智商較低,認知問題更多,”桑德斯說。

研究人員正在努力將這些碎片拼湊在一起:找到和診斷與嚴重結果相關的罕見變異很重要,但弄清楚自閉症的核心特徵如何與其他精神疾病相關聯並在普通人群中表現出來也很重要。“這兩個目標都很重要,它們不應被視為相互對立,”戴利說。事實上,五月份發表的一項研究報告稱, 罕見和常見變異可以結合起來 增加個體的風險。

當考慮到可能涉及的基因數量之多——一些研究人員估計多達一千個——以及許多高置信度自閉症基因也與其他疾病有關時,自閉症遺傳學的圖景變得更加複雜,這些疾病包括智力障礙和 癲癇 到精神分裂症和先天性心臟病。

桑德斯說,這種“多對一”和“一對多”的關係並不令人驚訝。但這確實意味著可能沒有純粹的“自閉症基因”。“但我可以反過來說,我們也沒有發現任何純粹的智力障礙或精神分裂症基因[也是如此];從根本上來說,這些疾病似乎是相關的,”他說。“如果我要說,‘我們能否找到一些比其他疾病更多地導致自閉症的東西?’那麼我認為答案是肯定的。”似乎與自閉症特別相關的基因可以為該病症的生物學提供重要的線索。

期待意外

迄今為止確定的基因暗示了導致自閉症的少數潛在機制。它們中的大多數似乎都參與了三大類任務:維持 突觸或神經元之間連線的功能;控制基因的表達;以及修飾染色質,即纏繞在稱為組蛋白的蛋白質“線軸”周圍的 DNA 結構。染色質決定了哪些 DNA 片段可以被讀取,從而影響基因表達。

從一開始,大腦疾病源於非典型神經元連線的想法就合乎邏輯。“人們對突觸非常感興趣,”桑德斯說。但控制基因表達的候選基因只是在遺傳研究中才出現。在“高置信度”列表中始終名列前茅的兩個基因——CHD8 和 SCN2A——都有些出人意料。CHD8 編碼一種染色質調節因子,可控制數千個其他基因的表達。SCN2A 編碼鈉通道,主要與嬰兒痙攣症有關。

研究人員使用基因表達圖譜,例如 BrainSpan 圖譜,追蹤了自閉症基因在大腦中何時何地活躍。他們發現,許多基因,包括 CHD8 和 SCN2A,在胎兒發育中期到晚期的皮層部分表達——這恰好是神經元形成的高峰期。“我們還不真正理解它,但它們很可能擾亂妊娠中期胎兒的大腦發育,”格什溫德說。那個時間點表明它們干擾了對皮層設定至關重要的過程,包括形成哪些型別的細胞以及它們在大腦中的遷移位置。他說,如果皮層設定不正確,就會對神經元之間的交流以及其他重要功能造成持續的問題。他說,在未來幾年內,研究人員將對受影響的神經元和迴路有更深入的瞭解。

在動物和細胞模型中的研究揭示了新神經元的產生、結構和命運以及它們之間的連線也存在類似的問題。在某些綜合徵型自閉症的細胞和動物模型中,科學家們已經設法至少部分地用藥物糾正了其中的一些問題。這些發現尚未實現的承諾是,即使在成年人中,自閉症的某些特徵最終也可能被證明是可逆的。

加州大學舊金山分校精神病學系主任、許多大型自閉症遺傳學研究的首席研究員 馬修·斯特特說:“這裡存在一些可塑性的想法,而不是在出生時就一成不變,這非常重要。”

與此同時,遺傳發現為自閉症患者帶來了一些直接的好處。“如果你今天走進一家診所,你大約有 10% 的機會獲得基因診斷,我預計在另外 5% 到 10% 的人中會發現提示性證據,”桑德斯說。“我們不能回頭說,‘這是你的治療方法’,但我們至少可以做的是讓人們與其他具有相同突變的人取得聯絡。”成為這樣一個群體的一份子,可以讓人們更好地瞭解自己的未來,併為他們提供支援和理解。

倡導團體可以遊說研究人員和資助機構,為他們的疾病研究做出貢獻,並幫助尋找臨床試驗的參與者——透過根據潛在的遺傳學對人群進行分組,這將更有可能獲得成功。“這變得非常令人鼓舞,”紐約西弗自閉症研究與治療中心主任 約瑟夫·巴克斯鮑姆說。

基因診斷還可以幫助家庭做出關於家庭計劃和治療方案的決定。例如,染色體 17 上一個名為 17q12 的區域的缺失與自閉症和精神分裂症有關,但用某些情緒穩定劑或抗精神病藥物治療患有此 CNV 的人可能是危險的:它也與腎功能衰竭和成人發病糖尿病有關,這些藥物會加劇這些疾病。更重要的是,某些突變會增加患某些型別癌症的 風險。“瞭解這些突變在這些情況下非常有幫助,不僅在治療自閉症方面,而且在更廣泛地治療患者方面,”格什溫德說。

尋找更多基因

關於如何最好地推動該領域發展,存在許多爭論,但大多數研究人員都同意的一件事是,需要識別更多與自閉症相關的突變。“現在僅僅做更多的外顯子組測序就有很大的好處,”桑德斯說。“還有更多的基因有待發現:這些基因有望幫助患者;它們也將使我們更深入地瞭解自閉症是什麼。”

然而,大部分使人易患自閉症的變異可能位於非編碼區域。“如果一半的變異發生在編碼區域之外,我們需要知道如何解釋它們,”威格勒說。“僅憑這一點,我們就必須研究該區域。此外,我們將在這個過程中學到大量的生物學知識。”

非編碼區域構成了“暗基因組”,約佔整個基因組的 98%。由於對整個基因組進行測序的成本和工作量,大多數自閉症研究人員直到最近才一直專注於外顯子組。幾個團隊現在正在對自閉症患者的整個基因組進行測序,目的是識別這些非編碼區域中的風險變異。“全基因組測序不可避免地將取代外顯子組測序,”桑德斯說。“這只是一個經濟問題,即它的時刻是現在,還是在兩年後,還是五年後。現在,這是一個很難回答的問題。”

今年 3 月,加拿大研究人員報告了迄今為止最大規模的自閉症患者全基因組資料集的結果。他們對 5000 多名個體(其中約一半患有自閉症)的整個基因組進行了測序。在研究人員確定的 61 個變異中,有 18 個之前沒有 被明確地與自閉症聯絡起來。該團隊發現,自閉症患者的許多 CNV 位於非編碼區域。

一些團隊正在應用其他資源,例如基因共表達圖譜和蛋白質-蛋白質相互作用網路,來理解該病症的潛在生物學。隨著研究人員發現更多自閉症風險基因,這些網路可能會變得更加強大。“問題是如何將所有這些遺傳資料與其他“-組學”資料整合起來,而網路型別的方法可能在那裡至關重要,”格什溫德說。

大多數源於基因發現的自閉症研究都集中在分子和細胞水平的影響上,但從那裡到整個迴路和行為之間存在重要的差距。“最終,遺傳學的價值很可能透過改進對迴路水平功能和解剖學的理解來發揮作用,”斯特特說。

幹細胞和新興技術(例如腦類器官——所謂的培養皿中的“迷你大腦”)可以為研究人員提供研究人類神經元中遺傳變異影響的絕佳機會。面對小鼠模型在研究以行為問題為特徵的疾病方面的侷限性,一些團隊也正在 轉向猴子,這使他們能夠研究更復雜的社互動動。“我們未來應該做的一件事是將我們在人類身上發現的精確突變應用於靈長類動物,”威格勒說。

如今,威格勒又有了另一個偉大的想法:風險修飾因子。與自閉症密切相關的罕見變異也發生在沒有自閉症的人身上——尤其是女性。研究人員知道,突變可以透過放大或減弱其他基因的影響來導致自閉症,因此兩種突變可能會相互抵消是可行的。但很少有團隊研究過這些組合。“人們將自閉症視為一種累加性疾病,”威格勒說,“但沒有人真正關注累加性。”

這個想法讓他想到一個可能的實驗:取出兩個單獨具有破壞性影響的突變,並將它們都引入小鼠或猴子。具有這種組合預計會比單獨具有任何一種突變更糟糕。“但如果最終結果是糾正呢?”威格勒問道。“那麼我們就知道修飾因子是存在的。現在沒有太多那種科學探索正在發生。”

這種性質的發現將預示著新一輪的進展。它也可能有助於解釋為什麼迄今為止發現的突變在其影響(或遺傳學家所說的“外顯率”)方面有所不同——有時才會導致自閉症。它也可能幫助研究人員開發療法。“如果我們曾經在自閉症的兩個突變中看到自我糾正缺陷,”威格勒說,“我會站起來歡呼。”

這個故事最初 發表於 Spectrum

延伸閱讀

© .