人類基因組首次釋出20週年反思

需要新一輪的研究來充分利用人類“最奇妙的地圖”

J.克雷格·文特爾。

2000年6月26日,在白宮東廳,我站在講臺上宣佈人類基因組測序完成,這個專案是由我公司的相對較小的團隊在短短九個月內完成的。坐在我身後的是克林頓總統,一個巨大的螢幕上顯示著英國首相托尼·布萊爾。弗朗西斯·柯林斯作為美國國立衛生研究院人類基因組團隊的負責人也在臺上。坐在我面前的是一些與人類基因組測序相關的高階科學家,以及來自世界各地的政府高階官員和大使。來賓身後大約有50臺電視攝像機和攝影師。整個活動正在全球直播。

經過多年的不懈努力、批評(來自外界甚至我公司內部)、頂級科學期刊編輯甚至克林頓總統的干預,能在當天站在創造歷史的地方,是一種非常激動和滿足的體驗。很難相信我們走到了這一步,而且在活動前甚至到凌晨都充滿了戲劇性。我們都必須在活動前一天分享我們的演講稿,當我看到布萊爾首相的演講稿時,我告訴科技政策辦公室負責人,除非他的演講稿被修改,否則我不會出席。我認為他的演講稿片面,幷包含貶低我和我團隊的言論。白宮科學顧問表示他們不能更改外國政府首腦的演講稿。我說如果他們希望我出席,他們就需要做些什麼。我在凌晨 2 點接到一個電話,表示我對他的演講稿會非常滿意,而事實也的確如此。

我們是如何走到這個歷史性時刻的?基因組測序的討論始於 1980 年代中期,促成了美國國立衛生研究院/能源部基因組專案,該專案獲得了數十億美元的資金,但由於將基因組片段分散到世界各地的多個實驗室進行,進展緩慢。我在我的第一個非營利研究機構——基因組研究所(TIGR)的團隊獲得了資助來完成一小部分工作,並認為我們會退出基因組專案。


關於支援科學新聞

如果您喜歡這篇文章,請考慮支援我們屢獲殊榮的新聞報道,方式是 訂閱。透過購買訂閱,您正在幫助確保關於塑造我們當今世界的發現和想法的有影響力的故事的未來。


1995 年,我們在《科學》雜誌上發表了第一個自由生活生物——流感嗜血桿菌的基因組。這個基因組是使用我們的新演算法和自動化技術進行測序的,可以在幾個月而不是幾年內將基因組作為一個單獨的專案進行測序。我確信這種方法對人類基因組也適用,但只有少數人相信這一點。1998 年,我的世界發生了改變,應用生物系統公司(ABI)及其母公司打來電話,提出給我 3 億美元,讓我成立一家新公司,使用我的技術和他們的新機器對人類基因組進行測序。我飛到他們在加利福尼亞州福斯特城的總部,查看了他們新機器的原型版本,並確信它會起作用。我們計算出我們需要 300 臺機器。回到 TIGR 後,我告訴諾貝爾獎獲得者、我的朋友和同事哈姆·史密斯,我看到了什麼,並說我必須去做這件事。他的回答是:“我不認為它會起作用,但我會和你一起去。”

我們成立了一家名為塞雷拉基因組學(Celera Genomics)的新公司,目標是在三年或更短的時間內對第一個人類基因組進行測序。該公司的口號是“速度至關重要,發現不能等待”。這一宣佈並沒有受到美國國立衛生研究院主導的測序社群的歡迎,他們說塞雷拉的測序計劃最終會導致“瑞士乳酪”、“簡易讀本”、“讀者文摘”甚至是“瘋狂雜誌”版本的人類基因組。我想我可以理解他們為什麼對新來者不感興趣,因此開始了媒體所謂的“人類基因組測序競賽”,塞雷拉與美國國立衛生研究院和國際基因組專案展開競爭。

我們知道我們用於細菌基因組的演算法不適用於人類,現有的計算機也不行。我們收到了數千份簡歷,幸運的是其中一份來自尤金·邁爾斯,他最終成為人類基因組的關鍵英雄之一。當時是亞利桑那大學教員的吉恩一直是測序分析的 BLAST 工具的關鍵開發者,他一直在思考更大的基因組組裝問題,並受到我們在細菌基因組方面取得的成功的鼓舞。吉恩和一個小團隊在幾個月內編寫了 50 萬行計算機程式碼,建立了塞雷拉組裝器。九個月後,我們得到了完整的人類基因組序列,並著手對其進行註釋,以瞭解它告訴我們什麼。在已故的《科學》雜誌編輯唐·肯尼迪介入推翻了試圖阻止我們出版的公共專案領導人之後,我們才在《科學》雜誌上發表了我們的分析。美國國立衛生研究院的專案在同一天在《自然》雜誌上發表了他們的資料。

那麼,在 2001 年 2 月 16 日首次發表人類基因組測序 20 週年之際,在過去的二十年裡,我們取得了什麼成就?出版後的第一個十年在測序技術方面取得了穩步進展,使得越來越多的各種生物的基因組得以測序,但不幸的是,在產生關於人類基因組的知識和理解方面幾乎沒有付出努力。部分原因是美國政府層面的大量資金減少,而其他國家的資金卻在增加。好訊息是,基本上每種新藥和疫苗現在都基於基因組學,基礎研究已從基因測序轉變為更多基於功能的研究。

許多人認為,僅僅透過對大量基因組進行測序,理解和新知識就會自然而然地產生。雖然這有助於進行祖先追溯和基因組變異研究,但關於基因組如何編碼我們人類,我們仍有許多需要學習和理解的地方。

五年前,我制定了一種新方法,將全面的表型分析與使用機器學習/人工智慧演算法和其他工具的深度基因組分析相結合。之所以提出新方法,是因為我的基因組顯示,我是 APOE 基因的雜合子,這會大大增加患阿爾茨海默病的風險。我說服了加州大學聖地亞哥分校的一些神經科醫生做了一次核磁共振腦部掃描和一次澱粉樣蛋白的核磁共振/PET 掃描,澱粉樣蛋白被認為是該疾病的關鍵標誌物。對我個人來說,好訊息是這兩項測試的結果都是陰性,但這讓我看到我需要將核磁共振等臨床表型測試與基因組結合起來,以瞭解預測風險。這促成了一家名為 Human Longevity, Inc (HLI) 的新公司的成立。

HLI 的目標是為自我描述為健康的人提供我們一天內可以完成的最全面的臨床測試,例如全身核磁共振、心臟 CT 掃描、骨密度、4-D 回聲心臟測試和遠端心臟監測。我們包括了大量的化學測試,包括完整的代謝組學篩選。對所謂的健康人進行的這些綜合測試的結果確實令人震驚。大約 40% 到 50% 的受測者患有他們自己並不知道的嚴重疾病。大約 5% 的 50 歲以上的人患有嚴重的腫瘤。好訊息是它們幾乎都處於早期階段,可以透過手術切除或放射治療。大約 1% 的所有受測者患有腦動脈瘤。機器學習正在提供與發現的疾病相關的新基因組位點。我們也在尋找像我這樣具有 APOE 變化但沒有阿爾茨海默病,或者具有 BRCA 突變但沒有乳腺癌或卵巢癌的女性的保護性遺傳標記。

這種測試看似健康的人的理念並非沒有批評者。有些人認為,如果你尋找,你就會發現一些東西,而我們可能沒有治療或治癒該疾病的方法,從而造成不必要的痛苦。或者他們說,有些腫瘤可能生長緩慢,因此對其進行治療會導致不必要的副作用;因此,“等待觀察”是一種更好的方法。正如我試圖透過我的職業生涯展示的那樣,我對這種方法並不滿意。我認為我們有義務利用我們努力開發和發現的所有工具和知識,包括具有最大潛力的工具——我們的人類基因組。

總而言之,醫學實踐需要徹底改變。如果我們大規模地將基因組學與臨床表型分析和機器學習相結合,我們可以預防和預測疾病。阻礙這一進展的一個因素是,醫療保健系統的激勵機制是提供治療而不是預防。藉助新的臨床工具,可以在最早階段發現癌症和其他疾病,此時治療和潛在的治癒方法具有最小的侵入性。

基因組將在未來的生物經濟中發揮關鍵作用,但美國已經遠遠落後。我們在全球新的 COVID-19 病毒株的序列篩選方面排名第 54 位。除了癌症之外,基因組並不是醫學實踐的一部分。我們都認為基因組序列將使我們瞭解自己並改變醫學。這種情況發生得太慢了,如果我們將它作為國家優先事項,本可以拯救數千萬人的生命。一個例子是,相對容易知道誰最容易死於 COVID-19 和流感。隨著更多新出現的傳染病幽靈的出現,我們需要儘快採取行動,而不是拖延。

當我在白宮新聞釋出會上宣佈基因組時,我曾說過:“塞萊拉公司使用的方法已經確定了五個個體的遺傳密碼。我們已經對三名女性和兩名男性的基因組進行了測序,他們自稱為西班牙裔、亞裔、高加索裔或非裔美國人。我們這樣做並非出於排斥,而是出於對美國多樣性的尊重,並幫助說明種族概念沒有遺傳或科學依據。在五個塞萊拉基因組中,沒有任何方法可以區分不同的種族。社會和醫學將我們都視為人群的成員,而作為個體,我們都是獨一無二的,人口統計資料並不適用。”我仍然堅持這個觀點。事實上,我們今天發現的是,社會經濟背景對健康的可及性和結果的影響比任何其他因素(無論是生物因素還是其他因素)都更大。COVID-19 大流行就是這方面一個真實世界的、即時的例子。

只有敢於走前人未曾走過的路,才能取得進步。正如克林頓總統在 2000 年白宮活動中揭幕第一張人類基因組圖譜時所說,“這是人類創造的最重要、最奇妙的地圖。”我們需要更多的探索者和更多的資金來充分利用這張地圖,以揭示人類基因組中尚未發現的新的“土地”。

© .