人類基因組十年:序列之後的科學

人類基因組草圖序列的完成是在十年前宣佈的。對生命科學家的調查表明,生物學將從此面目全非。Declan Butler 報道。

作者:Declan Butler

“憑藉這種深刻的新知識,人類即將獲得巨大的、新的治癒能力。它將徹底改變大多數(如果不是全部)人類疾病的診斷、預防和治療。” 比爾·克林頓總統於 2000 年 6 月 26 日在白宮東廳的活動中宣佈,以慶祝由公共資助的國際人類基因組計劃及其私營部門競爭對手,馬里蘭州羅克維爾的塞萊拉基因組公司完成人類基因組序列的第一個草圖組裝。

十年過去了,人們希望的對抗人類疾病的革命尚未到來——《自然》雜誌對 1000 多名生命科學家的調查顯示,大多數人預計這種情況在未來幾十年內也不會發生。然而,該序列帶來的卻是生物學領域的革命。它改變了科學家的職業生涯,激勵他們去解決新的生物學問題,並在此過程中提出了一些尖銳的新挑戰。


關於支援科學新聞

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保關於塑造我們當今世界的發現和想法的具有影響力的故事的未來。


幾乎所有接受調查的生物學家都受到了人類基因組序列可用性的影響。高達 69% 的《自然》雜誌調查受訪者表示,人類基因組專案要麼激勵他們成為科學家,要麼改變了他們的研究方向。大約 90% 的人表示他們自己的研究受益於人類基因組的測序——其中 46% 的人表示“顯著”受益。近三分之一的人在研究中“幾乎每天”都使用該序列。“對於像我這樣的年輕研究人員來說,很難想象生物學家在沒有它的情況下是如何工作的,”一位科學家寫道。

這項調查主要透過《自然》雜誌的印刷版和網站吸引參與者,旨在粗略衡量意見,它還揭示了研究人員如何面對關於他們自己基因組的日益增長的資訊可用性。大約 15% 的受訪者表示他們在醫療環境中進行了基因檢測,近十分之一的人使用過直接面向消費者的基因檢測服務。當被問及如果他們可以對任何東西進行測序,他們會選擇對什麼進行測序時,許多受訪者列出了他們自己的基因組、他們孩子的基因組或其他家庭成員的基因組(該列表還包括一些寵物狗和貓)。

有些人顯然對這個機會感到不耐煩:大約 13% 的人表示他們已經對自己的 DNA 的一部分進行了測序和分析。五分之一的人表示,如果花費 1000 美元,他們就會對其整個基因組進行測序,而大約 60% 的人如果花費 100 美元或如果該服務是免費的,他們也會這樣做。其他人對自己的基因組測序則要謹慎得多——大約 17% 的人勾選了“即使有人付錢我也不做”的選項。

《自然》雜誌的調查還衡量了該序列對科學本身產生最大影響的領域。儘管近 60% 的受訪者表示他們認為基礎生物科學已從人類基因組序列中顯著受益,但只有約 20% 的人認為臨床醫學也同樣如此。我們的受訪者承認,解釋該序列被證明是比破譯它更大的挑戰。大約三分之一的受訪者將該領域對基因組生物學的基本理解不足列為當今利用序列資料的主要障礙之一。

序列只是開始

過去十年的研究表明,基因組的複雜性,以及事實上人類生物學的幾乎每個方面,都比以前想象的要大得多。例如,識別構成基因組約 1.5% 的約 20,000 個蛋白質編碼基因是相對簡單的。但研究人員指出,瞭解這一點並不一定能解釋這些基因的作用,因為許多基因編碼多種形式的蛋白質,每種蛋白質都可能在多種生物過程中發揮不同的作用。“我認為,需要整個序列才能讓我們看到我們的一基因一蛋白質的遺傳模型過於簡單化,”一位受訪者寫道。

後基因組生物學的十年也讓人們重新關注蛋白質編碼基因之外的區域,其中許多區域可能透過調節蛋白質編碼基因的表達和產生大量非編碼 RNA 分子而具有關鍵功能。“現在我們明白了,”另一位調查受訪者寫道,“如果不研究基因組的動態,確定其序列的用途是有限的。” 一些大型專案正在進行中,以填補空白,包括 DNA 元件百科全書 (ENCODE) 和人類表觀基因組計劃,該計劃旨在瞭解基因組的化學修飾,現在認為這是控制基因表達的主要手段。

根據調查,基因組序列的最大影響是貿易工具的進步:測序技術和計算生物學。技術創新使測序成本大幅下降,並且每日序列輸出量飆升。“深度測序技術現在正在成為科學研究的主要內容。如果不是完成人類基因組所需的技術推動,這種情況會發生嗎?” 一位受訪者寫道。

資料夢想,分析噩夢

然而,更便宜、更快的測序帶來了自身的問題,我們的調查揭示了許多研究人員感到多麼沒有能力處理呈指數增長的序列資料。首要關注的問題——幾乎一半的受訪者都提到了——是缺乏足夠的軟體或演算法來分析基因組資料,緊隨其後的是合格的生物資訊學家的短缺,以及在較小程度上是原始計算能力。其他擔憂包括資料儲存、測序資料的質量以及基因組組裝的準確性。美國馬里蘭州貝塞斯達國家生物技術資訊中心主任戴維·利普曼在評論調查結果時表示,對資料處理和分析的擔憂甚至在基因組專案的最早討論中就出現了。他認為,也許“有一種失望,儘管擁有如此多的資料,我們仍然有很多不瞭解的地方。”

貝塞斯達國家人類基因組研究所 (NHGRI) 所長埃裡克·格林表示,該研究所非常清楚需要更多的生物資訊學專家、更好的軟體以及更清楚地瞭解基因組之間的差異如何影響人類健康。他說,該研究所計劃在 2010 年底釋出其下一個基因組學領域的五年戰略計劃。3 月下旬 NHGRI 研討會上討論的一種可能的解決計算挑戰的方法是雲計算,實驗室從 Google、Amazon 和 Microsoft 等公司購買遠端計算農場的計算能力和儲存空間。5 月 10 日在英國劍橋歐洲分子生物實驗室的歐洲生物資訊學研究所啟動的歐洲核苷酸檔案也將為實驗室提供其基因組資料的免費遠端儲存和生物資訊學工具的使用。

鑑於 10 年的後見之明和目前的一系列障礙,研究人員現在對人類基因組學能夠交付的內容和時間抱有較為適度的期望,這並不奇怪。對人類基因組進行測序和探索的理由——徹底改變新藥物、診斷和疫苗的發現,並根據個人的基因構成量身定製治療方法——今天仍然相同。但現在幾乎一半的受訪者表示,在 2000 年之前,人類基因組的好處被過分誇大了。“雖然我確實覺得人類基因組專案取得的成果非凡,並且對我的研究產生了重大影響,但我仍然覺得它對普通民眾的宣傳過度了,”一位典型的受訪者寫道。超過三分之一的受訪者現在預測,基於遺傳資訊的個性化醫療將在 10-20 年內變得普遍,而超過 25% 的受訪者甚至認為需要更長的時間。大約 5% 的人預計這輩子不會發生。“我們對基因組的理解不會在一瞬間出現。它將是一個由數十億個較小見解組成的有組織的層次結構,”加州大學聖克魯斯分校基因組生物資訊學小組負責人 David Haussler 說。

格林說,當人類基因組計劃設想時,當時的科學領導人預測,生成第一個序列需要 15 年,而生物學家理解它需要一個世紀。“我認為他們說得差不多,”他說。“雖然我們仍然沒有所有答案——在手頭擁有人類基因組序列的情況下,我們僅僅走過了這個世紀的 10%——但我們已經瞭解了有關人類基因組如何運作以及如何改變它帶來疾病風險的非凡事情。”

Haussler 表示同意。“在最初的十年中發生的一切仍然只是當我們將開始真正理解基因組時,即將發生更巨大變化的早期預兆,”他說

© .