十年前,生物學家和非生物學家都對耗資30億美元的人類基因組計劃的醫學前景充滿樂觀。在2000年夏天白宮儀式上宣佈人類“生命之書”的第一份草圖時,比爾·克林頓總統預測,基因組計劃將“徹底改變大多數(如果不是全部)人類疾病的診斷、預防和治療”。
一年前,時任美國國家人類基因組研究所所長,或許也是該專案最不知疲倦的熱情支持者弗朗西斯·S·柯林斯,描繪了“個性化醫療”的宏偉願景,該醫療很可能在2010年之前從該專案中湧現:屆時將提供基因檢測,以指示個人患心臟病、癌症和其他常見疾病的風險,隨後不久將推出為個人量身定製的預防措施和療法。
甚至在人類染色體中DNA“字母”的第一個完整序列被破譯之前,一個資金雄厚的基因組學巨頭——配備了強大的測序和繪圖技術、蓬勃發展的資料庫以及柯林斯所說的從基因組中“挖掘奇蹟”的邏輯遊戲——就著手識別人類重大醫學災難背後的關鍵基因。
支援科學新聞事業
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞事業 訂閱。透過購買訂閱,您正在幫助確保未來能夠繼續產出關於塑造我們當今世界的發現和想法的具有影響力的報道。
快進到2010年,科學界發現自己變得冷靜和分裂。問題不在於基因組計劃本身,它徹底改變了基礎研究的速度和範圍,揭示了以前被稱為“垃圾DNA”的物質中隱藏的目的,甚至在我們基因組中檢測到了尼安德特人DNA的痕跡。癌症研究員伯特·沃格爾斯坦呼應了一種普遍的情緒,他說:“人類基因組計劃從根本上改變了我們進行科學研究的方式。”
問題在於,源於基因組計劃的研究迄今未能兌現柯林斯和其他人在十年前做出的醫學承諾。位於馬薩諸塞州劍橋市的懷特海生物醫學研究所的腫瘤生物學家羅伯特·A·溫伯格表示,癌症基因組學的回報“相對 modest——與投入的資源相比非常 modest”。美國國立衛生研究院前院長哈羅德·E·瓦姆斯最近在《新英格蘭醫學雜誌》上撰文稱,“只有少數重大變革……已進入常規醫療實踐”——他補充說,其中大多數是“在人類基因組揭示之前就已有的發現”的結果。杜克大學人類基因組變異中心主任大衛·B·戈爾茨坦說:“可以公平地說,我們明年不會實現常見疾病的個性化治療。”
或許期望在短短10年內就出現奇蹟是不合理的(儘管基因組專案發起人有預測)。然而,在今天的失望背後,隱藏著一個更令人不安的問題:迄今為止研究的醫學影響出人意料地 modest,是否表明科學家們一直在追求錯誤的策略來尋找常見疾病的遺傳原因?這種策略從根本上來說,涉及搜尋基因DNA文字中的輕微變異,這些變異可能會共同增加個體患上常見疾病的風險。多年來,許多科學家一直在追求這樣一種假設,即某些常見變異在患有特定疾病的人群中尤其普遍,並且發現這些變異將有助於理解對2型糖尿病和動脈粥樣硬化等重大、生物學上覆雜疾病的易感性是如何從一代人傳遞到下一代人的。未能找到對疾病有顯著影響的基因變異是否意味著“常見變異”假說是錯誤的?
這個問題在醫學研究界引發了裂痕。一方面,主要的基因組科學家堅持認為常見變異策略正在奏效。Broad 研究所(懷特海研究所的附屬機構)主任埃裡克·S·蘭德表示,最近三年,識別疾病遺傳線索的研究“令人震驚”,“我們甚至還沒有觸及常見變異的表面”。他說,醫學革命將隨著技術的進步而到來——即使不是為我們,也會為我們的孩子到來。換句話說,這場革命只是遲到了。
另一方面,越來越多的生物學家開始堅稱,常見變異策略是有缺陷的。在今年四月發表在《細胞》雜誌上的一篇備受爭議的文章中,華盛頓大學的遺傳學家瑪麗-克萊爾·金和喬恩·M·麥克萊倫認為,“絕大多數[常見]變異與疾病沒有已確立的生物學相關性,也沒有用於預後或治療的臨床效用。” 英國科學界元老級人物、遺傳學家沃爾特·博德默直言,研究常見變異的策略“在科學上是錯誤的”。
當一些基因組科學家慶祝迄今為止取得的進展時,另一些人看到同樣的結果,卻主要看到失敗,現在他們正在問:我們接下來該怎麼辦?對答案的追求可能會將醫學研究帶入全新的途徑,以理解人類疾病以及疾病如何在世代之間傳遞。
失望
常見變異假說在1990年代首次提出時,似乎是一個合理的賭注,它提出許多常見的人類疾病可能可以透過遺傳相對少量的常見基因變異來解釋。基因傳統上被定義為編碼蛋白質的DNA片段。這些變異可以被認為是同一基因的略有不同的、突變的文字,改變了DNA的蛋白質編碼部分或附近調節基因“表達”(蛋白質合成)速率和時間的DNA。蛋白質在細胞中執行許多工,其功能或濃度的缺陷可能會破壞分子通路,或對健康重要的相互作用鏈。
認為常見變異將有助於理解疾病的信念具有一定的進化邏輯。蘭德說,數萬年前,人類祖先的快速和近期的人口爆炸“鎖定”了人類基因庫中的許多變異。賭注是,這些常見變異(“常見”通常意味著在給定人群中至少出現5%)將相當容易找到,並且相對少量的變異(從幾個到幾十個)將塑造我們對高血壓、痴呆症和許多其他廣泛疾病的易感性。與疾病相關的基因變異及其編碼的蛋白質,以及它們在其中發揮關鍵作用的途徑,然後可能成為藥物的潛在靶點。
然而,從一開始,這個方案就遭到了一些反對。1993年,賓夕法尼亞州立大學的進化生物學家肯尼斯·M·韋斯,從列夫·托爾斯泰的小說《安娜·卡列尼娜》中,轉述了他關於家庭的名言,以闡明覆雜疾病的遺傳學觀點:“所有健康的家庭都彼此相似;每個不健康的家庭都有其自身的不健康方式。” 韋斯和哥倫比亞大學統計遺傳學家約瑟夫·D·特威利格反覆提出的觀點是,常見變異可能具有非常小的生物學效應;如果它們造成了強大的危害,自然選擇就會阻止它們在人群中變得常見。相反,他們認為,對生物學上覆雜疾病的易感性可能源於遺傳了許多罕見的促病變異,在任何給定的個體中,這些變異可能達到數百甚至數千個。用托爾斯泰的話說,病人以他們自己的方式在基因上是不幸的。這個論點來自一個自稱“邊緣瘋子”的人,並沒有贏得多少支持者。
要看誰是對的,顯而易見的方法是測序患病和健康個體的完整基因組,並使用強大的計算機,識別在患有給定疾病的患者中出現但在對照組中未出現的DNA變異。與過去的標準遺傳研究(依賴於基於生物學的懷疑,認為特定基因在疾病中起作用)不同,這種“不可知論”的比較可能會揭示任何和所有DNA罪魁禍首,包括那些以前未被懷疑重要的罪魁禍首。但在10年前,技術上不可能採取這種方法,而常見變異假說——如果正確的話——為發現導致常見疾病的基因提供了一條捷徑。
受常見變異假說指導的基因組科學家開始計劃大規模研究,稱為全基因組關聯研究(通常稱為GWAS,或“gee-waz”),該研究依賴於DNA中的地標,稱為單核苷酸多型性或SNP(發音為“snips”),以揭示疾病中重要的常見基因變異。SNP發生在整個染色體中,是DNA中的位點(不一定在基因內),其中一個人的DNA中的單個程式碼字母可能與另一個人的DNA中相同位置的字母不同。該計劃是檢查大量SNP,這些SNP在人與人之間經常變化,以檢視哪些版本在患有特定疾病的人群中頻繁出現。統計學上與疾病相關的SNP然後將引導研究人員找到附近的基因變異(與地標一起遺傳),這些變異可以解釋這種關聯。
然而,該計劃需要組裝一個圖譜,就像是常見人類SNP的圖譜。在過去的十年左右,生物學家收集了越來越多的SNP,以指導他們尋找疾病的遺傳根源,從1998年的SNP聯盟(該聯盟組裝了每個人類染色體上這些地標的地圖)開始,發展到HapMap(該圖譜編目了更大範圍的SNP,稱為單倍型)。在過去的五年中,全基因組關聯研究已經查看了數萬名個體患者和對照組的基因組中的數十萬個常見SNP,以尋找與常見疾病相關的SNP。
生物學界的裂痕就發生在這裡。蘭德和其他人讚揚最近發現的常見、與疾病相關的SNP是通往醫學重要途徑的門戶。誠然,最近來自大型基因組聯盟的大量論文已經揭示了數百個與精神分裂症、2型糖尿病、阿爾茨海默病和高血壓等疾病相關的常見SNP。弗朗西斯·柯林斯最近在PBS的《查理·羅斯訪談錄》節目中聲稱,科學家們已經“弄清楚”了近1,000個常見基因變異“如何在疾病風險中發揮作用,我們已經利用這些資訊來改變我們開發治療糖尿病、癌症和心臟病的新療法的整個觀點”。然而,其他人指出,到目前為止,這些資料在預測疾病風險方面並沒有太大用處。例如,在2型糖尿病中,分析超過10,000人的220萬個SNP的關聯研究已經確定了18個與該疾病相關的SNP,但根據杜克大學的戈爾茨坦的說法,這些位點總共僅解釋了該疾病遺傳性的6%——幾乎沒有因果生物學。
2008年,戈爾茨坦告訴《紐約時報》:“令人震驚的是,我們已經破解了人類基因組,並且可以檢視所有常見的基因變異,我們發現了什麼?幾乎什麼都沒有。這絕對令人難以置信。” 去年夏天,戈爾茨坦談到常見變異/常見疾病假說已經成為過去:“我們已經進入並離開了那個領域,它解釋的遠不如很多人想象的那麼多。”
普林斯頓大學的大衛·博特斯坦對建立單倍型圖譜的策略提出了大致相同的結論:“它必須被完成。如果沒有嘗試過,沒有人會知道它不起作用。” 他說,耗資1.38億美元的HapMap是“一次輝煌的失敗”。
沃爾特·博德默是20世紀80年代最早提出基因組計劃的人之一,也是主導近期基因組學的關聯研究的先驅,他斷言,搜尋常見基因變異是一條生物學死衚衕。“幾乎不可能找到這些變異基因的生物學效應是什麼,這絕對是關鍵,”他說。“絕大多數[常見]變異都沒有揭示疾病的生物學機制。”
新的前進方向
目前關於常見變異假說的爭論不僅僅是一場深奧的科學辯論。它至少提出了一種替代的前進方向,以解決許多人所謂的“缺失的遺傳性”問題,至少在短期內是這樣。例如,博德默一直敦促研究人員將目光轉向罕見的基因變異。常見變異的終點和罕見變異的起點之間的界限並不精確——按照博德默的定義,“罕見”指的是在人群中發生頻率為0.1%至1%或2%的特定基因突變(遠低於當前大多數全基因組關聯研究的解析度)。但該假說的主要思想是,具有較大疾病相關效應的基因變異往往是罕見的,而常見的基因變異幾乎總是產生可忽略不計或中性的效應。
同樣的論點出現在金和麥克萊倫在《細胞》雜誌上發表的爭議性文章中,這篇文章在今年春天在基因組學界引起了如此多的敵意——蘭德將這篇文章貶為“觀點文章”。金(她發現了數百種導致家族性乳腺癌的BRCA1和BRCA2基因的罕見變異)和麥克萊倫(她也發現了許多導致精神分裂症遺傳學的罕見變異)正在提出一種理解複雜疾病的“新正規化”。他們認為,大多數這些疾病都是“異質的”(意味著許多不同基因中的許多不同突變可以產生相同的疾病),大多數高影響突變是罕見的,並且許多罕見的基因變異是基因庫中相對較新的補充。在患者中識別出的罕見變異因此可以將研究人員引導至與特定疾病相關的特定分子通路,而對這些通路的生物學理解可以提出新的治療干預措施。
博德默、《細胞》雜誌的作者和其他人指出,海倫·H·霍布斯和喬納森·C·科恩的工作是一個典範,說明如何使用生物學作為指導,揭示埋藏在基因組中具有醫學意義的資訊。霍布斯-科恩方法側重於疾病的極端案例,假設強烈擾亂生物學的罕見基因變異是造成極端情況的原因,並且會鮮明地突出出來。他們還基於生物學知識,挑選和選擇在這些人中檢查哪些基因。並且,他們對特定的候選基因進行測序,尋找人與人之間細微但功能上顯著的變異,而不是使用SNP關聯,後者可以指示疾病相關基因的遺傳鄰域,但通常不是基因本身。
2000年,當基因組學領域的大新聞是生物技術公司塞雷拉基因組學創始人J·克雷格·文特爾與NIH科學家之間的競賽,以產生人類基因組序列的第一個粗略草圖時,霍布斯和科恩悄然啟動了一個名為達拉斯心臟研究的專案,以幫助揭示心臟病的原因。科恩是一位南非生理學家,多年來一直研究膽固醇代謝(其合成和分解)。霍布斯接受過醫學博士培訓,現在是德克薩斯大學西南醫學中心達拉斯分校的霍華德·休斯醫學研究所的研究員,她曾在邁克爾·S·布朗和約瑟夫·L·戈爾茨坦的實驗室進行研究,他們因在膽固醇代謝方面的工作而共同獲得1985年諾貝爾獎,這反過來為開發流行的降膽固醇藥物(稱為他汀類藥物)奠定了基礎。
霍布斯和科恩根據生物學“直覺”設定了他們的科學方向,這代表了一種與幾乎所有其他從事基因組學研究的人完全不同的策略。他們招募了大約3,500名達拉斯縣居民(其中一半是非洲裔美國人),然後對他們進行了強化醫學檢查。他們不僅關注基因組(儘管他們盡職盡責地收集了每個人的DNA),而且還收集了許多因素的非常精確的測量值,這些因素
可能導致冠狀動脈疾病:血液化學(包括膽固醇值)、代謝、體脂、心臟功能、動脈增厚(透過高科技成像評估)和環境影響。在兩年多的時間裡,他們編制了一個龐大而高度詳細的個體身體特徵資料庫——遺傳學家稱之為“表型”。
在那之後,他們將基因組學注意力集中在具有特別顯著表型的人身上——特別是高密度脂蛋白(HDL,通常稱為“好”膽固醇)或低密度脂蛋白(LDL,“壞”膽固醇)的極高或極低值。他們對基因組的搜尋絕不是不可知論的。正如科恩所說,“我們從更實用的角度來看待這個問題。”
正如他們在2004年《科學》雜誌上報道的那樣,他們首先研究了血液中HDL濃度非常低的患者,這種情況會增加患心臟病的風險。他們知道有三個基因與罕見的膽固醇代謝紊亂有關,因此他們比較了極低HDL患者和高HDL水平人群中這些基因的DNA序列,發現了幾種與極度降低的HDL水平相關的罕見變異。他們還報告說,受影響基因的突變“顯著貢獻”於一般人群中低HDL值。
2005年,霍布斯和科恩將注意力轉向達拉斯心臟研究中發現LDL水平異常低的人群。當研究人員分析了稱為PCSK9的基因的DNA序列時,他們獲得了基因組學上的巨大成功,已知該基因參與膽固醇代謝。使該基因沉默的兩個突變與低LDL水平相關。在一項後續研究中,該研究分析了過去15年從密西西比州、北卡羅來納州、明尼蘇達州和馬里蘭州人群中收集的資料,霍布斯和科恩確定,在PCSK9中具有一種或另一種沉默突變的非裔美國人LDL水平降低了28%,冠心病風險驚人地降低了88%。在白人中,同一基因中的突變使LDL降低了15%,心臟病風險降低了47%。幾乎沒有數百項全基因組關聯研究發現對疾病風險有如此大影響的基因。
製藥公司已經在測試關閉PCSK9基因或擾亂該基因影響的分子通路的分子,以此作為降低LDL和降低一般人群心臟病風險的一種方法。霍布斯說,PCSK9現在是幾乎每家制藥公司的“十大目標”之一。
認識到常見變異方法識別的基因的微小影響,並受到霍布斯-科恩工作成功的鼓舞,同樣在杜克大學的大衛·戈爾茨坦和伊麗莎白·T·西魯利最近提出擴大對醫學上重要的罕見變異的搜尋。例如,一個想法是在精心挑選的人群中測序和比較整個“外顯子組”。外顯子組是染色體中基因的實際蛋白質編碼部分(外顯子)的集合,以及調節基因活性的附近區域;它不包括位於外顯子或基因之間的DNA片段。西魯利和戈爾茨坦還建議在受常見疾病影響的家庭或具有極端性狀的人群中尋找這些罕見變異,在這些人群中,可以更容易地識別出顯著的DNA差異。這項工作已經在許多實驗室進行中。“我們每天都在實驗室對外顯子組進行測序,”華盛頓大學的金說。然而,外顯子組測序是一種權宜之計,直到廉價、可靠的全基因組測序變得可用,可能在三到五年內。
謹防兔子洞
一些勇敢的聲音正在暗示,人類生物學的兔子洞可能比關注DNA序列和蛋白質所能揭示的還要深。他們說,傳統遺傳學可能無法捕捉基因的分子複雜性及其在疾病中的作用。曾經被斥為“垃圾”的DNA廣闊區域,現在已知隱藏著重要的調控區域。例如,一些DNA片段產生少量RNA,可以干擾基因表達。而DNA上的化學“標籤”不會改變其序列——因此是“表觀遺傳的”——也會影響基因表達,並且可以在一生中被環境因素改變。這種環境修飾的DNA甚至可能傳遞給後代。
簡而言之,基因的定義——更不用說具有醫學意義的基因了——現在被多層複雜性所困擾。曾經被認為是基因和性狀之間直接的、單向的、點對點的關係,現在已經變成了“基因型-表型問題”,其中瞭解DNA的蛋白質編碼序列只告訴我們性狀是如何形成的。一部分。
在動物實驗中,西雅圖系統生物學研究所的科學發展主任約瑟夫·H·納多追蹤了100多種受表觀遺傳變化影響的生化、生理和行為特徵,並看到其中一些變化傳遞了四代。“這完全是拉馬克式的!”他笑著說,指的是18世紀生物學家讓-巴蒂斯特·拉馬克的觀點,即後天獲得的性狀可以遺傳。
似乎這種複雜程度還不夠,納多有實驗證據表明,一個特定基因的功能有時取決於圍繞它的特定基因變異組合——這種整體效應為疾病的遺傳解釋引入了語境化的後現代皺紋。納多說,這表明一些常見疾病最終可能追溯到網路或通路中的大量基因,這些基因的影響可能因人擁有的基因變異而異;例如,一種基因變異的存在可能會加劇或抵消該組中另一種疾病相關基因的影響。“我的猜測是,這種非常規的遺傳方式將比我們預期的更常見,”納多說。
納多提出的這些方面在疾病中究竟有多強大仍不清楚。與此同時,新一代快速、廉價的測序技術將很快使生物學家能夠比較整個基因組,到那時,常見變異與罕見變異的爭論可能會消退到古代歷史中。目前的缺失遺傳性難題遠沒有給該領域蒙上陰影,甚至像金這樣的常見變異懷疑論者也對未來幾年感到興奮。“現在我們有了適當解決這些問題的工具,”她說。“想象一下達爾文和孟德爾用這項技術能做什麼。現在是從事基因組學研究的絕佳時機。” 然而,這一次,沒有人預測醫學奇蹟的時間表。