基因檢測的巨大飛躍:評估心臟病、乳腺癌及其他疾病的風險

這種預測醫學的新方法以風暴之勢席捲基因組學研究,但仍存在爭議

660萬——這就是 Sekar Kathiresan 在人類基因組上尋找的點位數,用於計算一個人患冠狀動脈疾病的風險。Kathiresan 發現,在這些選定位置上,人與人之間單個 DNA 字母差異的組合可能有助於預測某人是否會死於全球主要死因之一。沒有人知道這些 A、C、T 和 G 中的大多數在做什麼。然而,Kathiresan 說,“你可以根據你出生時就已確定的東西,將人們劃分為清晰的心臟病發作軌跡。”

Kathiresan 是波士頓馬薩諸塞州總醫院的遺傳學家,他並不是唯一一個計算出驚人數量變異的人。他開發的多基因風險評分是尋找常見疾病遺傳因素的前沿方法的一部分。在過去的二十年中,研究人員一直在努力解釋包括心臟病、糖尿病和精神分裂症在內的疾病的遺傳性。多基因評分將基因組上數萬至數百萬個位點的微小(有時是無限小的)貢獻加在一起,以建立迄今為止一些最強大的基因診斷方法。

這種方法之所以能夠興起,歸功於許多資源充足的佇列研究和大型資料儲存庫,例如英國生物樣本庫(參見第 194 頁、203 頁和 210 頁),這些研究收集了來自數十萬人的大量健康資訊以及 DNA 資料。過去一年左右發表的一些研究透過整合來自這些來源的資訊,能夠分析超過一百萬的參與者,從而提高了科學家檢測微小效應的能力。


支援科學新聞事業

如果您喜歡這篇文章,請考慮支援我們屢獲殊榮的新聞事業,方式是 訂閱。透過購買訂閱,您正在幫助確保有關塑造我們當今世界的發現和想法的具有影響力的故事的未來。


支持者表示,多基因評分可能是基因組醫學的下一個巨大進步,但這種方法也引發了相當大的爭議。一些研究提出了關於如何使用這些評分的倫理難題:例如,在預測學業成績方面。批評者還擔心人們將如何解讀從測試中出現的複雜且有時模稜兩可的資訊。而且,由於主要的生物樣本庫缺乏種族和地域多樣性,目前的基因篩查工具可能僅對資料庫中代表的人群具有預測能力。

英國牛津大學的遺傳學家馬克·麥卡錫說:“大多數人都熱衷於就此進行認真的辯論,因為它引發了各種後勤、社會和倫理問題。”即便如此,多基因評分正迅速走向臨床,並且至少有一家美國公司已經向消費者提供。

澳大利亞昆士蘭大學的遺傳學家彼得·維舍爾是該趨勢背後方法的先驅,他對這種方法持 broadly 樂觀態度,但仍然對進展的速度感到驚訝。“我絕對相信這種情況會比我們想象的來得更快,”他說。

風險計算

當研究人員在 2000 年代初期完成人類基因組的第一個草圖時,許多人預計這將標誌著醫學革命的開始。遺傳學家開始尋找可能解釋為什麼一個人會患上糖尿病或心臟病而另一個人不會患病的原因的差異。這個想法很簡單:將一組患有該疾病的人與一組沒有該疾病的人進行比較,並尋找他們 DNA 中的差異。這些變異通常以 DNA 字母交換的形式出現,稱為單核苷酸多型性或 SNP。如果患有某種疾病的人在某個位置傾向於有 T,而其他人有 C,則表明該 SNP 在某種程度上與該疾病相關。

這些全基因組關聯研究——或 GWAS,正如它們後來為人所知的那樣——變得非常流行。但是,經過多年的搜尋,科學家仍然只能解釋常見疾病遺傳風險的一小部分。加利福尼亞州拉霍亞斯克裡普斯研究所的遺傳學家阿里·託卡馬尼說,事實證明,大多數這些疾病與比科學家最初預期的更多的 SNP 相關。

更糟糕的是,大多數變異帶來的風險非常小——只有在調查大量人群時才能檢測到。“我們沒有足夠的樣本量來真正像某些人天真地認為的那樣推動預測,”英國欣克斯頓歐洲生物資訊學研究所所長伊萬·伯尼說。到 2007 年,遺傳學家們開始擔心他們所謂的“缺失的遺傳性”。很明顯,許多這些疾病都具有遺傳成分,但 GWAS 顯然沒有捕捉到太多。

今天,情況正在發生變化。Kathiresan 說,隨著可以訪問海量資料集以及資料分析方法的進步,科學家們越來越擅長衡量那些非常小的風險。

Kathiresan 用來生成他的 660 萬 SNP 評分的技術就是一個很好的例子,該評分於 8 月份釋出。他和他的團隊使用了 2015 年薈萃分析的資料,該分析整合了 48 項 GWAS,包括 61,000 名冠狀動脈疾病患者和 120,000 名對照組。然後,他們在英國生物樣本庫的 290,000 人身上測試了他們的多基因預測因子,發現得分最高的幾個百分位的人平均患該疾病的風險是其餘人口的幾倍(參見“多基因預測工具”)。例如,在獲得最高評分的 23,000 人中,7% 患有冠狀動脈疾病,而其餘人口中只有 2.7%。該小組對其他四種疾病(包括炎症性腸病和乳腺癌)進行了類似的分析,每次都識別出一組得分在最高几個百分位且風險特別高的人群。

該論文受到了一些研究人員的讚揚,認為它證明了多基因風險評分在理論上可以用於臨床。Kathiresan 說,評分識別高風險人群的能力與醫學中使用的現有風險衡量標準相似。“本質上,你擁有的是冠狀動脈疾病的一種新的風險因素。”

Kathiresan 的工作成為頭條新聞並引發了一些爭議——原因是風險評分中包含的變異數量巨大。巴爾的摩馬里蘭州約翰霍普金斯大學彭博公共衛生學院的生物統計學家尼蘭詹·查特吉說,在這 660 萬個 SNP 中,只有一小部分實際上對預測做出了貢獻,他沒有參與這項研究。這是因為這些型別的評分是如何計算的:所有變異的資料都被輸入到一個演算法中,該演算法根據每個變異與疾病的關聯程度為其分配權重,而大多數變異實際上帶來的風險很小或可以忽略不計。

包括查特吉在內的許多研究人員表示,包含許多效果極小的變異無關緊要。但其他人擔心,包含數百萬個沒有任何作用的變異可能會破壞公眾對評分的信任。佐治亞州亞特蘭大埃默裡大學的流行病學家塞西爾·揚森斯說,她對這項研究並不印象深刻。她擔心的問題之一是,與僅由與疾病聯絡最緊密的 74 個 SNP 組成的評分相比,用於計算最終評分的數百萬個變異並沒有顯著提高效能。她說,如果這些型別的評分要用於臨床,“評分的可信度也很重要。”

行動方案

雖然 Kathiresan 的研究主要關注遺傳風險,但其他人正在研究多基因評分如何補充現有的風險衡量標準。2013 年,赫爾辛基大學的統計遺傳學家薩穆利·裡帕蒂發現,將多基因風險評分與冠狀動脈疾病的傳統風險因素(如高體重指數和高血壓)相結合,可以提高對誰會患上該疾病的預測。他還能夠識別出一組遺傳風險評分高但在其他方面僅被認為是中等風險的人,裡帕蒂說,這種挑出那些在雷達下飛行的人的能力是多基因風險評分的最大好處。

基因風險評分還可以改進乳腺癌等疾病的篩查方案。在美國,目前建議女性從 50 歲開始進行乳房 X 光檢查,但如果能夠識別出更年輕的高危女性,她們可能會從更早的篩查中受益。2016 年,查特吉開發了一種乳腺癌模型,該模型結合了傳統風險因素和從大約 90 個 SNP 計算出的多基因評分。根據這些評分,他預測 40 歲女性中有 16% 的風險相當於平均 50 歲女性——這表明她們可以從 40 歲開始接受篩查。該團隊現在正在其他資料集和更大數量的 SNP 中測試其模型,以檢視預測是否成立。

與此同時,位於猶他州鹽湖城的個性化醫療公司 Myriad Genetics 已經開始在其為某些女性提供的結果中包含乳腺癌的多基因風險評分。只有大約 10% 的有乳腺癌家族史的女性攜帶與該疾病相關的有害單基因突變,因此該公司現在向其餘 90% 的女性返回一個評分,該評分根據多基因風險以及病史和生活方式等因素告知她們患乳腺癌的可能性。Myriad 的首席科學官傑瑞·蘭奇伯裡說,這些評分的優勢之一是它們為每個人都提供了結果。雖然目前的重點是識別高風險女性,但在未來,他可以看到這些評分被用於尋找那些風險低於平均水平的人,這些人可能會從較不頻繁的乳房 X 光檢查中受益。“我們開始進入一個可以為每個人提供精準醫療結果的世界,”蘭奇伯裡說。

一切都在統計中

對多基因評分的一個抱怨是,它們拋棄了生物學而偏愛統計學。多基因評分本身不會為藥物開發提供太多見解,但這些研究可以為深入研究個體變異並找出它們影響哪些基因以及可能導致疾病的機制提供起點。

這種見解的一部分將來自理清哪些變異實際上產生了給定的性狀或疾病,哪些只是隨波逐流。與疾病相關的 SNP 不一定是其原因:它可能僅僅是該變異傾向於與直接相關的基因組另一部分一起遺傳。例如,Kathiresan 估計,在他的 660 萬個 SNP 中,只有大約 6,000 個與冠狀動脈疾病有因果關係。麥卡錫說,隨著樣本量越來越大,將這些變異區分開來變得更容易。

當前的研究仍然無法解釋很大一部分遺傳風險。裡帕蒂估計,許多常見疾病的風險中有 30-50% 是遺傳性的——其餘大部分由環境因素決定。但缺失的遺傳性問題仍然存在:根據經驗法則,GWAS 目前可以解釋大約三分之一到三分之二的疾病遺傳風險,維舍爾說。託卡馬尼說,隨著樣本量越來越大,研究人員可能會發現更多導致風險的變異,儘管回報會減少。“在某個時候,你將不再從額外的遺傳風險因素中獲得太多效用,”他說。維舍爾補充說,全基因組測序也可能會發現更多的遺傳風險。目前,GWAS 研究主要使用僅對基因組一部分進行測序的陣列進行,但隨著全基因組測序變得更便宜和更普及,可能更容易找到導致疾病的較不常見的變異。

從實驗室到臨床

Kathiresan 說,他希望在明年將冠狀動脈疾病的評分推向市場。但大多數研究人員承認,在這些評分可以廣泛使用之前,還有障礙需要克服。麥卡錫說,首要障礙是將它們應用於不同人群。風險評分是在主要由歐洲血統的人組成的資料集中生成和驗證的,例如英國生物樣本庫,這限制了它們應用於其他種族人群的程度。例如,Myriad 的評分目前僅適用於具有歐洲背景的個人,儘管蘭奇伯裡表示該公司正在開發針對非裔美國女性的類似評分。麥卡錫說,最終目標是生成特定於種族的風險評分。

伯尼補充說,種族不是唯一的複雜因素。研究中分析的人群來自特定的醫療保健系統,他們的經驗不一定能跨越國界。例如,在英國和美國之間,心臟病發作的機會可能會有所不同,護理標準也可能有所不同。因此,評分可能無法轉化。

即使是將這些評分傳達給人們的簡單行為也帶來了一些擔憂。麥卡錫說,醫生不一定接受過遺傳學方面的培訓,“地球上沒有足夠的遺傳諮詢師”來進行遺傳風險評分將需要的細緻討論。伯尼說,人們普遍存在一種誤解,即因為我們的基因不會改變,“它在某種程度上是一種註定要實現的命運”。揚森斯擔心,如果人們認為患病的機會是硬編碼在他們的 DNA 中的,他們就不會有動力為此做任何事情。

對於可能被此類評分預測的非疾病性狀,這種擔憂變得更加尖銳。今年早些時候發表的一項針對超過 100 萬人的研究開發了一種多基因評分,該評分基本上與人們接受教育的時間長短相關。該研究的作者竭盡全力澄清,他們並沒有建議對得分極低的人進行任何形式的干預。“對這項或類似研究的任何實際響應——個人或政策層面——都將是非常不成熟的,”他們寫道。

Geisinger Health System 的生物倫理學家兼該研究的合著者米歇爾·邁耶說,該評分根本不具有可操作性。如果不瞭解評分所代表的生物學差異——或與這些差異相互作用的環境和社會因素——就不可能知道如何幹預。

談論遺傳學

瞭解人們將如何對多基因評分做出反應是研究人員的首要任務。裡帕蒂和他的同事已向芬蘭的 7,000 多人提供了有關他們患心臟病的可能性的資訊,這些資訊基於多基因評分和傳統風險因素(如高血壓)。裡帕蒂說,大多數受訪者表示,獲得這些資訊會激勵他們做出積極的改變。初步結果表明,遺傳風險高的人最有可能採取諸如減肥或戒菸之類的行動。

在附近的愛沙尼亞,研究人員正在對 100,000 人進行基因分型,這增加了該國已經取樣的 50,000 人。與許多其他生物樣本庫不同,愛沙尼亞專案的參與者可以註冊接收反饋。返回給他們的結果包括 2 型糖尿病和心血管疾病的多基因風險評分,愛沙尼亞塔爾圖大學愛沙尼亞基因組中心的遺傳學家莉莉·米拉尼說。與芬蘭的工作類似,參與者會看到生活方式改變如何降低或增加他們風險的圖表。米拉尼說,初步跡象表明,人們很高興獲得這些建議。

目前,人們正在從遺傳諮詢師那裡獲得他們的評分。但米拉尼正在與愛沙尼亞政府合作,研究如何將基因組資料整合到醫療保健系統中,以便醫生每天都可以使用它。米拉尼說,該國的最終目標是對任何有興趣的人進行基因分型,直至其全部 130 萬人口。“目標是建立一些非常偉大的東西,讓所有醫生都想推薦它,所有人口都想要它。”

本文經許可轉載,並於 2018 年 10 月 10 日首次發表

First published in 1869, Nature is the world's leading multidisciplinary science journal. Nature publishes the finest peer-reviewed research that drives ground-breaking discovery, and is read by thought-leaders and decision-makers around the world.

More by Nature magazine
© .