癌症基因組圖譜

查明與癌症相關的基因將有助於在人類惡性腫瘤的複雜領域中規劃新的方向

“如果我們希望更多地瞭解癌症,我們現在必須專注於細胞基因組。”諾貝爾獎獲得者雷納託·杜爾貝科在 20 多年前寫下了這些話,這是最早公開呼籲後來成為人類基因組計劃的倡議之一。“我們正處於轉折點,”開創性的癌症研究人員杜爾貝科在 1986 年的《科學》雜誌上宣稱。前幾年的發現已經清楚地表明,癌細胞的大部分異常行為源於其基因的損傷和功能的改變。“我們有兩個選擇,”他寫道。“要麼嘗試透過零敲碎打的方法發現與惡性腫瘤相關的基因,要麼對整個基因組進行測序。”

杜爾貝科和科學界的其他人士都認識到,對人類基因組進行測序雖然本身就是一項里程碑式的成就,但這僅僅標誌著充分了解癌症生物學探索的第一步。有了正常人類 DNA 中核苷酸鹼基的完整序列,科學家們接下來需要根據人類基因的功能對其進行分類——這反過來可以揭示它們在癌症中的作用。在過去的二十年裡,杜爾貝科的願景已經從痴人說夢變成了現實。在人類基因組計劃完成不到三年後,美國國立衛生研究院正式啟動了一項旨在建立癌症相關基因組變化綜合目錄的試點階段工作:“癌症基因組圖譜”(TCGA)。

以極大的緊迫性開展這項下一個雄心勃勃的大規模生物學事業的主要原因是癌症對人類造成的可怕傷害。每天有超過 1,500 名美國人死於癌症——大約每分鐘一人。隨著美國人口老齡化,除非研究人員找到加速識別癌細胞內新弱點並開發攻擊這些靶點的新策略的方法,否則預計這一比率在未來幾年將顯著上升。


支援科學新聞報道

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道: 訂閱。透過購買訂閱,您正在幫助確保有關塑造我們當今世界的發現和想法的具有影響力的故事的未來。


然而,無論意圖多麼崇高,僅僅渴望減輕人類痛苦不足以證明如此規模的研究事業是合理的。當應用於 50 種最常見的癌症型別時,這項工作最終可能會證明相當於超過 10,000 個人類基因組計劃,就待測序的 DNA 的絕對量而言。因此,夢想必須與對新興科學機會的雄心勃勃但切合實際的評估相匹配,以便對癌症發動更明智的戰爭。

基因疾病
細胞基因組的改變是所有形式癌症的核心的想法並不新鮮。自從 1981 年首次鑑定出人類基因的致癌版本(稱為癌基因)以來,科學家們越來越認識到,癌症主要是由特定基因的突變引起的。損傷可能是由於暴露於毒素或輻射、DNA 修復過程中的缺陷或 DNA 在細胞分裂前複製時發生的錯誤造成的。在相對罕見的情況下,癌症易感突變存在於從祖先那裡遺傳下來的基因變異中。

無論其起源如何,這些突變都會擾亂生物途徑,導致不受控制的細胞複製或生長,這是癌症的特徵,也是其他惡性腫瘤的標誌,例如侵入鄰近組織和擴散到全身各部位的能力。一些突變可能會使正常情況下防止細胞異常行為的基因失效,而另一些突變則會增加破壞性基因的活性。大多數細胞必須獲得至少幾個這樣的改變才能轉變成癌細胞——這個過程可能需要數年時間。

在過去的二十年中,許多獨立的研究小組使用了突破性的分子生物學技術來尋找可能對正常細胞生長和行為模式造成嚴重破壞的候選基因中的突變。這種方法已經鑑定了大約 350 個與癌症相關的基因,並對這種極其惡性的疾病產生了許多重要的見解。邁克爾·斯特拉頓小組在英國劍橋的韋爾科姆基金會桑格研究所維護著一個名為癌症體細胞突變目錄(COSMIC)的這些變化的資料庫。但是沒有人認為這是完整的列表。

那麼,當我們現在擁有大幅提高發現範圍和速度的手段時,繼續以家庭工業規模探索癌症的基因組基礎是否有意義呢?近年來,許多想法、工具和技術已經出現,更重要的是,它們以一種方式融合在一起,這讓癌症和分子生物學界的許多領軍人物相信,現在是時候對癌症基因組學進行系統、協作和全面的探索了。

人類基因組計劃透過建立正常人體組織基因組中 30 億個 DNA 鹼基對的標準參考序列,為 TCGA 奠定了堅實的基礎。現在需要另一項倡議來比較正常細胞和癌細胞基因組的 DNA 序列和其他物理特徵,以識別驅動癌症標誌性特徵的主要遺傳變化。人類基因組計劃也證明了國際合作夥伴關係在大規模生物學中彙集資源和加速科學發現的重要性,TCGA 正在探索類似的合作。

最後,人類基因組計劃推動了用於測序和分析基因組的技術的顯著進步。例如,在 1990 年該專案啟動時,DNA 測序的成本超過每“完成”的核苷酸鹼基 10 美元。今天,每個鹼基的成本不到一美分,並且隨著創新測序方法的出現,預計還會進一步下降[參見喬治·M·丘奇的《全民基因組》;《大眾科學》,2006 年 1 月]。由於這些和其他技術發展,TCGA 中體現的大規模方法——即使在幾年前也是不可想象的——已經成為識別癌症相關廣泛基因組因素的最有效和最具成本效益的方式。

概念驗證
當然,如果不能證明全面瞭解癌症的分子起源實際上可以改善人們的護理,那麼成堆的資料就沒有多大價值。最近的一些發展提供了概念驗證,即識別癌細胞中的特定基因變化確實可以為診斷、治療和預防該疾病指明更好的方法。它們為未來的發展提供了令人鼓舞的一瞥,也證明了為什麼通往這些回報的步驟是複雜、耗時且昂貴的。

2001 年,當韋爾科姆基金會桑格研究所開始自行努力使用基因組技術探索癌症時,該專案的直接目標是最佳化機器人技術和資訊管理系統,在涉及對 378 個癌症樣本中的 20 個基因進行測序的測試執行中。但是,該小組在一年後取得了突破,他們發現一個名為 B-RAF 的基因在他們檢查的大約 70% 的惡性黑色素瘤病例中發生了突變。各種研究人員迅速將目光投向這種最致命的皮膚癌中潛在的新治療靶點。他們在細胞系和小鼠中測試了多種方法——從經典化學藥物到小干擾核糖核酸——以檢視這些干預措施是否可以阻斷或降低 B-RAF 的活性或抑制一種名為 MEK 的蛋白質,該蛋白質由於 B-RAF 突變而過度產生。僅僅五年後,這些療法中最有希望的療法正在臨床試驗中進行測試。

其他研究小組已經專注於與某些型別的乳腺癌、結腸癌、白血病、淋巴瘤和其他癌症相關的基因突變,以開發分子診斷,以及預後測試,這些測試可以指出當前化療武器庫中的一種藥物,特定患者最有可能對其產生反應。癌症基因組學還幫助直接塑造了一些最新療法的開發和使用。

例如,藥物格列衛旨在抑制由兩個基因(稱為 BCR-ABL)的突變融合版本產生的酶,該酶會導致慢性粒細胞白血病。格列衛被證明對該疾病非常有效,並且在治療更復雜的遺傳性惡性腫瘤(如胃腸道間質瘤)和涉及類似酶的其他幾種相對罕見的癌症中也顯示出價值。赫賽汀是一種靶向稱為 HER2 的細胞訊號接收蛋白的藥物,它對 HER2 基因異常繁殖導致受體蛋白過度產生的乳腺癌有效。

基於患者癌症中特定基因突變選擇治療策略的方法也在肺癌藥物易瑞沙和特羅凱以及肺癌、結腸癌和其他癌症藥物阿瓦斯丁的研究中進行測試。這些新的基於基因的診斷、預後和治療方法的效能當然是好訊息,但此類干預措施的清單仍然遠遠短於學術界和私營部門的研究人員能夠隨時訪問癌症中發生的整個基因組變化圖譜的情況。

約翰·霍普金斯大學的研究人員最近領導的一項研究說明了應用於癌症基因發現的大規模基因組學的力量,以及全面的癌症基因組圖譜將是一項多麼巨大的事業。該小組對取自 11 名結直腸癌患者和 11 名乳腺癌患者的腫瘤組織中的約 13,000 個基因進行了測序,並報告發現近 200 個不同基因中可能存在顯著突變。有趣的是,只有大約十幾個基因先前與這兩種型別的癌症有關,而且大多數科學家通常預計只會發現更多幾個。

研究人員對癌細胞基因組進行測序時遇到的主要挑戰之一是難以區分腫瘤樣本中無意義的突變與癌症相關的突變。有點令人驚訝的是,早期的測序研究還發現,不同型別癌症中存在的基因突變幾乎沒有重疊,甚至同一型別癌症患者的腫瘤樣本中基因突變模式也存在顯著差異。這些發現強調了這樣一種觀點,即許多不同的突變組合可以將正常細胞轉化為癌細胞。因此,即使在患有相同身體器官或組織癌症的患者中,每個人腫瘤的遺傳譜也可能大相徑庭。

要掌握 TCGA 希望實現的全部範圍,必須考慮此類早期工作中確定的複雜性,並想象將這項工作擴充套件到 100 多種型別的癌症。這足以讓即使是人類基因組計劃的資深人士和經驗豐富的癌症生物學家也停下來思考。然而,TCGA 參與者和來自世界各地的其他科學先驅正在勇往直前,因為我們深信,在癌症基因組的複雜性中,可能蘊藏著拯救患者生命的最大希望。

儘管研究人員可能需要多年時間才能完成導致正常細胞變成惡性腫瘤的所有基因組突變的綜合目錄,但具有徹底改變癌症治療潛力的發現很可能在該概要完成之前就會出現,正如概念驗證所顯示的那樣。隨著每種新型別的癌症被研究並新增到 TCGA 中,研究人員將獲得另一組豐富的新基因組靶點和譜,可用於開發更具針對性的療法。

編纂巨型圖譜
在人類基因組計劃開始時被證明成功的分階段策略是在擴大到全面的 DNA 序列“生產”之前測試協議和技術。同樣,TCGA 正從一個試點專案開始,以開發和測試最終繪製癌症中所有基因組異常圖譜所需的科學框架。

2006 年,美國國家癌症研究所和美國國家人類基因組研究所選擇了將參與該試點專案的科學團隊和機構,以及他們將開始檢查的癌症型別。在未來三年內,這兩個研究所將投入 1 億美元,用於編纂三種腫瘤型別的基因組變化圖譜:腦膠質母細胞瘤、肺癌和卵巢癌。選擇這些特定癌症有幾個原因,包括它們在衡量將該專案擴充套件到更多癌症型別的可行性方面的價值。事實上,只有當這個試點階段實現其目標時,美國國立衛生研究院才會推進一個全面的專案來開發完整的癌症圖譜。

我們為試點選擇的三種惡性腫瘤每年在美國共造成超過 21 萬例癌症病例,僅在 2006 年就在美國造成約 19.1 萬人死亡。此外,符合專案嚴格的科學、技術和倫理要求的腫瘤標本庫也存在於這些癌症型別中。去年 9 月,我們的研究所宣佈選擇了三個生物樣本庫來提供此類標本,以及根據需要提供新的腫瘤樣本,以及來自同一患者的正常組織用於比較。這些機構將向中央生物樣本核心資源提供材料,中央生物樣本核心資源是 TCGA 試點專案中的四個主要結構組成部分之一。

癌症基因組表徵中心、基因組測序中心和資料協調中心構成了該專案的其他三個主要要素,所有這些小組將合作並公開交換資料。具體而言,七個癌症基因組表徵中心將使用各種技術來檢查腫瘤樣本中基因的活性水平,並揭示和編目所謂的導致癌症發生和發展的“大規模”基因組變化。此類改變包括染色體重排、基因複製數變化和表觀遺傳變化,表觀遺傳變化是對 DNA 鏈的化學修飾,可以在不實際改變 DNA 序列的情況下開啟或關閉基因活性。

癌症基因組表徵中心鑑定的基因和其他染色體區域將成為三個基因組測序中心的測序目標。此外,懷疑在癌症中很重要的基因家族,例如編碼參與細胞週期控制的酶(稱為酪氨酸激酶和磷酸酶)的基因家族,將被測序以鑑定其 DNA 程式碼中的基因突變或其他小規模變化。目前,我們估計在這個試點專案中將對大約 2,000 個基因——在每個可能 1,500 個腫瘤樣本中——進行測序。確切的數字當然將取決於獲得的樣本以及癌症基因組表徵中心對它們的發現。

測序和基因組表徵小組(其中許多是人類基因組計劃的參與者)都可以預期會遇到比正常細胞 DNA 中更高的複雜程度。一旦細胞癌變,隨著其自我控制和修復機制失效,它們更容易發生更高的突變率。因此,單個腫瘤內單個細胞的基因組構成可能會發生顯著變化,整合團隊需要開發穩健的方法來有效地區分潛在的具有生物學意義的突變“訊號”與許多腫瘤中看到的突變高背景率的“噪聲”。此外,腫瘤幾乎總是含有一些非惡性細胞,這會稀釋樣本。如果待測序的腫瘤 DNA 過度異質,則可能會遺漏一些重要的突變。

遵循人類基因組計劃和其他近期醫學基因組學工作的領導,所有這些資料都將迅速免費地提供給全球研究界。為了進一步增強其對基礎和臨床研究人員以及最終對醫療保健專業人員的實用性,TCGA 將其序列資料和基因組分析與有關原始腫瘤的可觀察特徵以及樣本捐贈者的臨床結果的資訊聯絡起來。因此,開發生物資訊學工具來收集、整合和分析這些海量資料,同時保護患者資訊的機密性,是將我們的願景變為現實的另一個必須清除的障礙。

未知的領域
未來的道路充滿了科學、技術和政策挑戰——其中一些是已知的,另一些是未知的。有待解決的不確定性包括:新的測序技術能否及時兌現其早期承諾,使這項工作在經濟上可行?我們改進和擴充套件系統地檢測癌症中表觀遺傳變化和其他大規模基因組改變(尤其是與轉移相關的改變)的工具箱的速度有多快?我們如何利用計算生物學的力量來建立對基礎生物學家、臨床研究人員以及最終對第一線的醫療保健專業人員有用的資料門戶?我們如何以一種既促進基礎研究又促進療法開發的方式來平衡智慧財產權?國會何時才能最終透過基因非歧視立法,以便透過 TCGA 獲得的知識能夠對美國人的健康產生最大的積極影響?清單還在繼續。

為了避免引起虛假的期望,我們還必須明確這個專案不會試圖回答的問題。儘管它將作為廣泛生物學探索的資源,但 TCGA 只是未來癌症研究的基礎,當然不是整棟房子。我們還面臨著時間的嚴峻問題——對於許多癌症患者及其家人來說,時間非常緊迫。當我們審視當前關於癌症基因組知識的地圖中存在的相當大的空白時,填補這些空白的前景既令人振奮又令人畏懼。科學家和公眾需要預先了解,這項前所未有的分子製圖探索將需要來自許多不同學科的數千名研究人員多年的辛勤工作和創造性問題解決。

所有這些工作將走向何方,今天只能隱約看到。從這個意義上說,我們的處境與 19 世紀早期的探險家梅里韋瑟·劉易斯和威廉·克拉克相似。當他們在 1804 年冒險沿著密蘇里河進入基本上未知的西北地區時,托馬斯·傑斐遜總統給他們的命令是“在所有顯著點記錄緯度和經度……。您的觀測結果必須以極大的細緻和準確性進行;清晰且易懂地輸入,供他人以及您自己使用。”

儘管劉易斯和克拉克沒有找到渴望已久的橫貫大陸的水路,但他們詳細的地圖證明對他們羽翼未豐的國家在傑斐遜永遠無法想象的無數方面都很有價值。為了所有那些生活已經並將被癌症觸動的人們,我們只能希望我們 21 世紀的癌症生物學遠征甚至超越雷納託·杜爾貝科最偉大的夢想。

癌症研究的新時代。 哈羅德·瓦爾姆斯,《科學》,第 312 卷,第 1162-1165 頁;2006 年 5 月 26 日。

人類乳腺癌和結直腸癌的共識編碼序列。 託拜厄斯·肖布洛姆等人,《科學》,第 314 卷,第 268-274 頁;2006 年 10 月 13 日。(2006 年 9 月 7 日線上釋出。)

通往惡性腫瘤的多種途徑

基因與癌症

靶向癌症中的基因變化

大眾科學雜誌第 296 卷第 3 期本文最初以“癌症基因組圖譜”為標題發表於《大眾科學雜誌》第 296 卷第 3 期(
doi:10.1038/scientificamerican032007-5PGqn7xrlrIkPoTRc7Ap8X
© .