十年前,人類基因組序列的釋出為世界提供了一份人類藍圖。但正如汽車零件清單無法告訴我們汽車發動機如何工作一樣,完整的基因組序列——人類細胞所有染色體中DNA“字母”的列表——並沒有揭示基因組如何指導我們細胞的日常活動,或如何讓個體從受精卵發育成功能健全的成年人。
為了更好地理解基因組作為一個整體如何協調被稱為生命的生物活動交響曲,我和基因組細胞生物學這個新領域的其他研究人員正在研究染色體及其包含的基因如何在細胞核的三維空間內排列,以及這種組織如何影響它們的活動。
藉助新的3D成像技術,使我們能夠比以往任何時候都更深入地觀察活細胞,我們發現了一個令人驚訝的充滿活力的生態系統。在細胞核中,染色體與相鄰染色體物理相互作用,這些染色體上的基因會根據它們需要完成的任務遷移到不同的核位置,而調節基因活性的分子則聚集在繁忙的中心。這些新發現為我們的基因組如何維持我們的健康以及某些疾病(包括某些癌症)如何產生提供了新的見解;它們也可能為診斷疾病帶來新的方法。
支援科學新聞報道
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保有關塑造我們今天世界的發現和想法的具有影響力的故事的未來。
早期問題
最近的進展源於20世紀80年代的發現。那時,生物學家知道染色體在細胞分裂過程中會高度凝縮,呈現出沙漏狀結構,當我們想到將我們的基因從一代傳遞到下一代的實體時,我們大多數人都會想到這種結構。他們也知道,當細胞不分裂並進行日常活動時,染色體具有更鬆散的形狀。這種鬆散的外觀使得即使使用最好的顯微鏡也難以辨別單個染色體,而普遍的觀點認為,不分裂細胞中的染色體像義大利麵一樣混雜在一個碗裡。
儘管有一些相反的暗示,但這種觀點仍然很普遍。在20世紀初,一位名叫西奧多·博韋裡的德國細胞科學家反對這種染色體組織的“義大利麵模型”。根據他對一種感染馬匹的蛔蟲的研究,他認為,儘管染色體在細胞的生命週期中可能會發生大小和形狀的變化,但每條染色體都佔據細胞核中一個獨特的、明確定義的區域。他將這些由單個染色體佔據的區域命名為“染色體領域”。但由於染色體難以觀察——而且由於博韋裡的蛔蟲不是典型的實驗系統——他的染色體領域概念長期以來一直被邊緣化。
染色體領域概念的明確實驗證據直到另外兩位德國人,托馬斯·克雷默和克里斯托夫·克雷默兄弟開發出一種標記和視覺化細胞核小區域遺傳物質的方法後才出現。在20世紀80年代早期,克雷默兄弟表明,當雷射束照射細胞核特定區域的DNA時,只有少數染色體會被標記出來。如果核DNA像之前認為的那樣混亂地混合在一起,那麼每次雷射脈衝都會擊中更多的染色體。
幾年後,研究人員完善了一種更有針對性和色彩鮮豔的方法來標記和視覺化整個染色體。這種方法——被稱為染色體繪畫——將熒游標記標籤附著到單個染色體中DNA程式碼字母的序列上。每條染色體都可以用特定的熒游標記進行標記,並精確定位其位置。這些研究明確地證明,染色體在細胞核中以不同的實體存在,佔據著與其他染色體分離的空間。
這一發現引發了許多問題,基因組細胞生物學家正在解決這些問題。染色體是否像開放座位的活動參與者一樣,隨機分散在整個細胞核中?還是染色體在細胞核內有“指定座位”?更重要的是,它們的位置是否影響它們所攜帶基因的活性?
偏愛的鄰域
我們現在知道,單個染色體傾向於佔據細胞核內的首選位置。例如,在人類白細胞中,18號染色體通常緊貼細胞核外壁,而19號染色體則傾向於留在中心;與此同時,7號染色體傾向於懸停在兩者之間。每條染色體傾向於佔據更靠近或更遠離核邊緣的首選位置,這也創造了整個細胞核中不同的鄰域。因此,每條染色體都有一組鄰居,在給定型別的細胞中,這些鄰居通常是一致的。例如,在對小鼠白細胞的研究中,我的同事和我發現12號染色體經常與14號和15號染色體聚集在一起。
然而,染色體的位置並非一成不變。我的實驗室發現,染色體在不同細胞型別中的排列方式不同,其他研究人員也發現,這些排列方式在發育和疾病過程中會發生變化。更重要的是,染色體所處的位置似乎會影響其攜帶的基因是否開啟或關閉。
一個暗示基因在細胞核內的位置可能對其活性很重要的線索來自一項發現,即某些基因的活性發生變化時,它們的位置也會發生變化。一個例子來自對一個名為GFAP基因的追蹤研究。星形腦細胞,稱為星形膠質細胞,通常有一個基因的活躍副本(用於製造基因指定的蛋白質的副本)和一個沉默副本。我實驗室的Takumi Takizawa發現,沉默的版本通常位於細胞核的邊緣,而活躍的副本則位於細胞核內部。其他人也發現了編碼防禦性抗體或免疫球蛋白的基因的類似定位,這些抗體是白細胞在受到入侵者刺激時分泌的。在被外來細胞置於警戒狀態的白細胞中,含有IGH基因(編碼免疫球蛋白成分)的染色體區域傾向於移動到細胞核中更中心的位置。總之,這些發現指向了一個簡單的規則,即基因的位置如何影響其功能:細胞核外圍的基因通常處於非活動狀態。
細胞核外側的某些東西是否有利於基因沉默?一個早期的跡象表明答案是肯定的,那是20世紀30年代的觀察結果,即細胞核外圍排列著異染色質——高度濃縮的染色體區域。如果你擁有超自然視覺,並且可以觀察染色體內部,你會看到它由雙螺旋DNA組成,這些DNA纏繞在由稱為組蛋白的蛋白質組成的線軸上,而這種線軸化的DNA會自身摺疊,形成稱為染色質的粗纖維。染色質纖維本身會進一步摺疊,變得越來越濃縮。異染色質是染色質的一種特殊形式,它特別緊密地盤繞,這種排列通常會阻止基因讀取蛋白質訪問底層的DNA。
當然,早期的觀察結果無法揭示外圍是否促進沉默——或者緻密的染色質是否因其他原因被吸引到該區域。但是,幾個實驗室在2008年進行的一系列精巧的實驗支援第一種觀點。當研究人員將活性基因從它們在細胞核內部的常規位置移除,並將它們束縛到包圍細胞核的膜上時,它們的活性通常會降低。因此,細胞核外圍有助於使至少一些基因保持沉默。
就細胞核內部而言,它也可能為那些需要快速或頻繁活動的染色體和基因提供一些特殊的東西:稱為轉錄工廠的蛋白質聚集物集合。這些“工廠”是啟用基因所需的細胞成分的聚集體,包括聚合酶(將DNA轉錄成RNA,RNA隨後被翻譯成編碼蛋白質)以及轉錄因子(與基因的調控區域結合並啟動聚合酶的蛋白質)。
牛津大學的彼得·庫克在1993年首次提出了這些工廠的存在,此前他注意到,細胞核中任何給定時間活躍基因的數量遠大於聚合酶忙於讀取基因的位點數量。解釋這種模式的一種顯而易見的方法是將多個基因聚集在轉錄活動的中心,在那裡它們共享聚合酶和轉錄因子。這個想法並非沒有先例:數百個編碼核糖體RNA(細胞蛋白質生產機制的重要組成部分)的基因在核仁中一起轉錄——核仁是一種足夠大的核內亞結構,可以在顯微鏡下看到。
健康攸關
基因組細胞生物學家尚未了解所有控制細胞核不同部位基因活動的規則。然而,我們已經表明,基因在核空間中的位置與正常發育和健康相關。
從胚胎幹細胞的研究中,已經出現了一個特別引人注目的例子,說明基因組織如何在正常的胚胎髮育過程中發生變化。這些細胞是“多能”的通才,具有獨特的能力,可以分化成體內220多種特化組織中的任何一種,例如神經細胞、血細胞或肌肉細胞。與完全分化的細胞不同,這些功能靈活的胚胎幹細胞缺乏基因沉默的大片異染色質區域。它們也缺乏稱為核纖層蛋白的蛋白質,這些蛋白質有助於將非活性DNA束縛到細胞核外圍。因此,幹細胞基因組中的幾乎每個基因都以低水平活躍。
當胚胎幹細胞接收到分化成骨細胞或神經元等細胞的訊號時,它們的核結構會發生巨大變化。核纖層蛋白出現並連線在一起,形成緊密的、交織的墊子——核纖層——位於核膜下方。據信,這種支援性核纖層可以維持細胞核的形狀,並保護染色體免受外部機械壓力的影響。但它似乎也參與了正常的基因調控。活性基因較少的染色體片段包含一種特定的結構蛋白,該蛋白將這些區域壓縮成異染色質——並將它們與細胞核外圍的核纖層蛋白結合在一起。這種隔離使富含基因的區域更靠近內部和基因工廠,從而使其能夠活躍起來。因此,核纖層蛋白在胚胎髮育過程中的出現使細胞能夠透過將不再需要的基因驅逐到邊緣來關閉它們。
這種對選定染色體區域的驅逐可能對分化細胞中正常的基因功能至關重要,這一觀點得到了對核纖層蛋白異常時發生的情況的觀察的支援。核纖層蛋白的突變會導致多種人類疾病,從肌營養不良症和神經系統疾病到早衰。所謂的核纖層蛋白病在廣度上是不尋常的:與大多數疾病(其中給定基因的任何突變都會導致相同的疾病)相比,核纖層蛋白的突變會導致異常廣泛的疾病譜。細胞生物學家不確定有缺陷的核纖層蛋白是如何導致這些疾病的。一種可能性是它們削弱了核纖層,使其無法保護細胞核免受機械力的影響,結果是脆弱細胞中的大部分基因組受到物理損傷,可能導致細胞死亡。另一種有趣的觀點是,有缺陷的核纖層蛋白可能在組織基因組的能力方面受到損害,從而將基因放置在錯誤的位置,並可能破壞其正常功能。
對患有核纖層蛋白相關疾病的患者細胞中染色體位置進行定位的研究傾向於支援最後一種理論:一項調查顯示,在攜帶核纖層蛋白疾病突變的細胞中,13號和18號染色體的位置異常重定位——從外圍到內部。然而,尚不清楚這種染色體重定位是疾病的後果還是促成因素。
染色體定位在某些癌症中起著更明確的中心作用。惡性細胞通常包含染色體“易位”——當一個染色體片段從一條染色體上斷裂並附著到另一條染色體上時形成的異常染色體。在某些情況下,這種易位會導致癌症,因為融合會產生一種促進細胞過度增殖的突變基因;在其他情況下,它們只是旁觀者。
事實證明,哪些染色體結合形成促癌易位受到染色體在細胞核中位置的影響:在細胞核中一起發現的染色體往往更頻繁地融合。以伯基特淋巴瘤為例。許多患有這種疾病的患者在位於8號染色體上的MYC基因和位於14號染色體上的IGH基因之間發生易位;在極少數情況下,MYC與2號染色體上不同的免疫球蛋白基因(稱為IGK)發生易位,更罕見的情況是與22號染色體上的IGL基因發生易位。2003年,我實驗室的Jeffrey Roix發現,MYC與其三個易位夥伴在細胞核中的平均距離與它們的易位頻率精確對應,這表明基因距離與易位機率之間存在聯絡。此後,在許多其他癌症中也發現了同樣的聯絡。
我的實驗室還表明,當染色體斷裂時,受損的末端會留在原地附近,並且不會遠離它們在斷裂時所處的位置。這種觀察解釋了為什麼聚集在同一鄰域的染色體比遙遠的染色體具有更大的融合機率。它也解釋了為什麼特定的易位是發生在一種組織而不是另一種組織中的癌症的標誌:因為染色體在不同的組織中排列方式不同。因此,例如,在腎細胞中彼此靠近聚集的染色體,在腎腫瘤中比在其他組織(如白細胞)的癌症中更有可能成為易位夥伴,因為在白細胞中,它們通常相距較遠。
該領域最令人興奮的進展之一是認識到,瞭解染色體通常在細胞核中駐留的位置可能會為癌症檢測提供機會。初步實驗表明,基因的位置可以幫助指示細胞是否癌變。在我實驗室進行的一項乳腺癌初步研究中,Karen Meaburn鑑定了幾個基因,這些基因在腫瘤細胞中的位置與正常乳腺組織細胞中的位置不同。事實證明,這些基因是乳腺癌的良好標誌物:它們使我們能夠以非常高的準確率挑選出癌變組織樣本。在惡性細胞中,一些基因的位置甚至在細胞開始表現不良之前就發生了變化。因此,我們有理由希望,基因位置分析有一天將成為幫助醫生在非常早期階段診斷癌症的強大分子工具。
自組織的細胞核
基因組細胞生物學領域的聖盃問題是,是什麼決定了基因或染色體在細胞核中的位置。基因和染色體如何知道去哪裡——以及當它們所在的細胞分化成其特化狀態時,它們如何到達那裡?
一種理論上的可能性是,染色體序列由特定的細胞機制護送到其適當的目的地。也許一種識別特定基因序列的DNA結合蛋白附著到該序列,然後——在分子馬達蛋白的幫助下——將染色體的該部分拖到細胞核中的特定位點。但到目前為止,還沒有人發現這樣的系統。而且很難想象一種訊號系統,它可以將一組地理座標傳遞給一段DNA,指示基因在細胞核中心附近徘徊或拜訪其最喜歡的轉錄工廠。
相反,我提出核定位是自組織的,有點像中學生因為共同的興趣而聚集在一起形成小團體,而不是因為父母或老師指示他們交往。在這種觀點中,基因和染色體在細胞核內部的位置源於它們的活動,而不是由某些外部組織機制決定的。反過來,它們的位置會影響它們的活動。
這種自組織是如何運作的呢?讓我們跟蹤在一個自組織細胞核中,當分化細胞中的單個基因響應訊號(例如,激素)而開啟時會發生什麼。在訊號到達細胞之前,基因處於非活動狀態——最有可能隱藏在濃縮染色質的一部分中,甚至可能在緊貼細胞核外圍的異染色質塊中。當訊號到達細胞核時,稱為染色質重塑複合物的分子會展開基因及其周圍的濃縮DNA,並使該區域更容易被轉錄機制訪問。在一個自組織細胞核中,這種鬆弛將允許染色質的該段從外圍的異染色質中環出並擺動,探索細胞核的新部分。如果運氣好,彎曲的環最終會與轉錄工廠接觸。
請注意,基因的這種運動——從細胞核外圍到活動中心——是在沒有專用運輸機制的幫助下發生的,並且完全由基因自身的活動驅動。因此,基因的位置是自決定的。該模型有一個有趣的推論:它表明,雖然基因的核位置不是隨機的,但它到達那裡的方式可能是隨機的。
自組織概念與基因追蹤實驗的許多結果相符。基因可以從染色體中環出並在細胞核中移動。一些基因甚至將這種轉錄的“漫遊通行證”發揮到了極致。當白細胞受到稱為細胞因子的激素刺激時,編碼稱為MHC II類分子的免疫系統蛋白質的基因會遠離它們所在的染色體主體——有時會延伸到細胞核的一半。
同樣的原則可能控制著整個染色體的定位。雖然大多數基因的運動都相當微妙,但每個基因都對其染色體最終在細胞中的位置做出了一點貢獻。因此,如果自組織是規則,那麼人們會預期,包含大部分非活性基因的染色體最終會被拉向細胞核外圍更具抑制性的區域,而主要包含活性基因的染色體則會被拖向細胞核內部。
為了檢驗這一預測,馬克·格魯丁和他在西雅圖弗雷德·哈欽森癌症研究中心的同事收集了血液前體細胞,然後觸發了它們的成熟。在不同的時間點,收穫細胞,並測量數千個基因的活性。與此同時,研究人員監測了這些基因所在的染色體的位置。結果:染色體上基因活性隨細胞成熟而變化最多的染色體顯示出最大的運動。
這些實驗是一個良好的開端,但它們很困難,因為同時在顯微鏡下監測許多基因組區域的位置非常繁瑣。一種潛在的革命性方法,稱為Hi-C,可能很快就能解決這個問題。這種方法由馬薩諸塞大學醫學院的喬布·德克爾開發,透過化學方式將細胞核中彼此接觸的所有染色體區域連線在一起,從而瞬間快照基因組的三維結構。使用Hi-C,生物學家應該很快就能夠確定來自不同組織、不同時間和不同條件下的細胞核中染色體的位置——並透過將這些模式與活性和非活性基因組進行比較,獲得對核組織如何影響功能以及破壞如何導致疾病的前所未有的見解。
產生人類基因組序列草圖的第一稿花費了大約10年的巨大努力。基因組細胞生物學家,受渴望瞭解比序列本身所能揭示的更多的東西的驅動,才剛剛開始揭示基因組在其細胞自然棲息地中的行為方式。這項任務雖然令人振奮,但也令人生畏。鑑於其複雜性,它很可能比當初對人類基因組進行測序花費的時間更長。