儘管“基因工程”這個術語已經使用了至少三十年,重組 DNA 技術現在已成為現代研究的主要手段,但大多數生物技術專家對生物體的工作與工程學幾乎沒有共同之處。原因之一是,用於構建生物部件的工具尚未達到其他工程領域那樣的標準化和實用性水平。另一個原因與生物學的方法和思維模式有關,儘管這些也可能受到技術的有力影響。
例如,電子工程從 1957 年開始轉型,當時快捷半導體公司(一家位於後來被稱為矽谷的小公司)的 Jean Hoerni 發明了平面技術。這是一種使用稱為光掩模的模板在矽晶片內分層和蝕刻金屬和化學品的系統。這種新方法使工程師能夠清潔且一致地生產積體電路,並透過僅更改光掩模上的圖案來建立各種電路型別。不久之後,工程師就可以從其他人制作的簡單電路庫中提取,並將它們組合成應用範圍越來越廣的日益複雜的設計。
在此之前,製造電子電路的標準做法是將各個電晶體逐個連線起來。這是一個手工過程,結果參差不齊,是新興電子行業公認的瓶頸。相比之下,平面技術不斷改進,以摩爾定律聞名的速度實現了驚人的進步。
關於支援科學新聞報道
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您將幫助確保有關塑造我們當今世界的發現和想法的具有影響力的故事的未來。
這種用於設計和製造半導體晶片的技術和方法——晶片工廠——構成了有史以來最成功的工程範例之一,並且是另一個新興技術領域——生物系統制造——的寶貴模型。
實際上,今天的基因工程師仍然在手工佈線每個電路。正如我們在麻省理工學院人工智慧實驗室的同事 Tom Knight 所觀察到的那樣,“DNA 序列組裝技術缺乏標準化,迫使每個 DNA 組裝反應既是解決當前研究課題的實驗工具,也是實驗本身。”
生物工程中方法和元件的標準化可以催生相容部件的設計庫,並使製造外包成為可能。概念和製造的分離將使生物工程師能夠想象日益複雜的裝置,並使用強大的工程工具(例如計算機輔助設計)來管理這種複雜性。為了實現這些目標,我們小組的成員已開始識別和開發可能成為生物工廠基礎的裝置和技術。我們也在努力鼓勵一個將工程學的最佳原理和實踐應用於生物技術的社群。
優質部件
如果說單個電晶體是電子電路的基本元件,那麼它們的生物學等價物就是基因:DNA 的長而有序的片段。因此,為了構建用於高階生物裝置的基因電路,我們需要一種以合理的價格快速、可靠地製造長 DNA 片段的方法。
二十年前,科羅拉多大學博爾德分校的 Marvin H. Caruthers 在他人早期工作的基礎上,開發了一種利用 DNA 天然化學性質合成單鏈 DNA 的系統。DNA 由核苷酸組成,核苷酸根據其包含的亞基型別(稱為鹼基)來區分:腺嘌呤 (A)、胞嘧啶 (C)、鳥嘌呤 (G) 或胸腺嘧啶 (T)。鹼基之間的親和力使它們彼此配對——A 與 T 配對,C 與 G 配對——形成梯狀雙鏈 DNA 分子的橫檔。化學基團在鹼基對之間以及沿任一鏈的相鄰核苷酸之間形成鍵。
Caruthers 的方法,稱為固相亞磷醯胺化學,仍然是大多數商業 DNA 合成的基礎。它從附著在固體支援物(如聚苯乙烯珠)上的單個核苷酸開始,懸浮在液體中。當暴露於酸時,核苷酸的鹼基變得可以與新增到溶液中的新核苷酸形成鍵。然後將第二個核苷酸暴露於酸,並將另一個核苷酸連線到它,從而有助於鏈的生長。重複此迴圈使得合成任何所需的核苷酸序列成為可能,錯誤率約為每 100 個鹼基中有一個鹼基。
不幸的是,生物工程師希望構建的許多基因構建體的長度遠遠超過這個長度。一個簡單的基因網路可能有數千個鹼基長;即使是細菌這樣的小型生物的基因組也可能達到數百萬個鹼基。因此,我們中一些致力於尋找具有更高產量和更低錯誤率的合成方法的人將目光投向了自然界以尋找線索。
在活生物體中,由聚合酶等酶組成的生物機器能夠以每秒高達 500 個鹼基的速度製造和修復 DNA 分子,錯誤率約為每十億個鹼基中有一個鹼基。與最好的 DNA 合成機相比,這代表了產量吞吐量(輸出除以錯誤率)提高了萬億倍,後者每 300 秒新增一個鹼基。此外,當複製長 DNA 片段(如細菌基因組)時,多個聚合酶並行工作,因此它們能夠在 20 分鐘內生產約 500 萬個鹼基。
我們中的一位(Church)著手透過改造現有的微陣列技術來模仿這種並行性。這些是大的載玻片,上面點綴著短的單鏈 DNA 片段,稱為寡核苷酸或寡核苷酸,長度約為 50 到 70 個鹼基。它們使用亞磷醯胺化學在微陣列表面上同時製造,以接近每平方釐米一百萬個點的密度錨定在網格圖案中。在傳統技術的基礎上,我們添加了可切割的連線臂,可以從微陣列中釋放特定的寡核苷酸。我們的實驗微陣列中的每個點大約 30 微米寬,包含大約 1000 萬個寡核苷酸分子。
我們將這些鏈稱為構建寡核苷酸,因為它們被設計為在序列中彼此重疊,以便以後可以組裝起來形成更長的 DNA 構建體,例如整個基因。但是,任何包含序列錯誤的寡核苷酸都必須被剔除。為此,我們研究了兩種不同的糾錯系統。
第一種方法使用相同的微陣列合成方法來生產我們稱之為選擇寡核苷酸的東西,其序列與構建寡核苷酸互補。然後,我們從載玻片上釋放選擇寡核苷酸,並用它們沖洗構建寡核苷酸陣列。選擇寡核苷酸將遵循鹼基配對規則並與其互補的構建寡核苷酸結合或雜交,以形成雙鏈 DNA。然後,我們可以將任何不匹配的構建寡核苷酸鏈或結合對中的嚴重缺陷識別為包含錯誤,並從陣列中釋放壞的寡核苷酸。有趣的是,儘管選擇寡核苷酸也很可能帶有一些錯誤——以與構建寡核苷酸相同的方式製成——但任一組中錯誤序列找到完美互補的可能性非常低。因此,使用一組寡核苷酸來校對另一組是一種有效的方法,使我們能夠建立平均每 1,300 個鹼基中只有一個錯誤的寡核苷酸。
正如人們可能預料的那樣,生物系統對準確複製自身感興趣,我們的第二種糾錯方法直接借用自自然界。我們中的一位(Modrich)在 10 年前首次研究了該過程的細節,並將其稱為 MutS、L、H。當兩條 DNA 鏈雜交但它們的 A-T 和 C-G 鹼基配對不完美時,雙鏈分子在錯配位置不會呈現螺旋形狀。MutS 是一種天然存在的蛋白質,可識別並結合此類缺陷,並最終招募其他蛋白質 MutL 和 MutH 來糾正錯誤。我們中的一位(Jacobson)與麻省理工學院的 Peter Carr 一起使用該系統實現了合成 DNA 每 10,000 個鹼基中只有一個鹼基的錯誤率,這足以產生小的基因網路。
這些技術——可釋放的並行合成和糾錯——使我們能夠比迄今為止更快、更經濟地組裝長而相對無錯誤的 DNA 構建體。因此,它們可以構成生物工廠的基礎,並且很像半導體晶片光刻技術,預計這些工藝會隨著時間的推移不斷改進。這使我們可以思考我們將在工廠中構建什麼。
修訂和改進的自然
我們最早的目標之一是使用生物工廠平臺探索對抗疾病的新方法。我們中的兩位(Keasling 和 Baker)運營的實驗室致力於為困擾人類的兩種最隱匿的疾病——瘧疾和 HIV——開發治療方法。儘管我們正在研究不同型別的療法,但我們兩個小組的工作都嚴重依賴於合成長而精確的 DNA 片段的能力。因此,我們的專案提供了生物工廠方法將如何大大改變生物醫學科學家開發新療法的方式的例子。
就瘧疾而言,已經存在一種治療方法,可以從感染者的身體中根除致病寄生蟲。它是小分子 C-15 倍半萜,俗稱青蒿素,一種由黃花蒿植物製成的天然化合物,主要產於中國北方。然而,這些樹木產生的這種物質太少,無法以可承受的成本廣泛部署這種藥物。這就是 Keasling 小組在過去五年中一直致力於複製基因集合(稱為基因通路)的原因,該基因集合負責在樹木中製造青蒿素並將其插入酵母中以大規模生產該化合物。
一旦進入酵母體內,這條途徑也可以被修改為比在天然植物中執行得更有效。到目前為止,我們已經能夠重新設計基因的關鍵子集(統稱為甲羥戊酸途徑),以生產一種稱為紫穗烯的青蒿素前體,其產量是原始途徑在細菌中產生的 100,000 倍。進一步提高產量,達到使藥物廣泛可用的程度,將需要我們以整合的方式重新設計整個青蒿素途徑。
完整的途徑由九個基因組成,每個基因的平均長度約為 1,500 個 DNA 鹼基。因此,我們構建的每個新版本的途徑都包含大約 13,000 個鹼基。如果我們能夠製作途徑中每個基因的變體,那將對我們有所幫助,這樣我們就可以看到哪些組合效果最好。僅製造每個基因的兩個變體意味著合成 29 或 512 個構建體,總共約 600 萬個核苷酸鹼基。使用傳統的 DNA 合成技術,這是一個極具挑戰性的目標,但如此大量的 DNA 可以容納在單個微陣列晶片上。
使大規模合成基因網路成為可能的技術也可用於生成新型蛋白質,例如用於合成化學反應或環境廢物修復的新型催化劑,以及用於基因治療或病原體破壞的高度特異性酶。Baker 的小組正在開發用於設計此類新型蛋白質結構的計算方法,包括兩種模擬 HIV 表面基本特徵的結構,這些結構已在作為潛在疫苗進行測試。
問題在於計算機模型不夠先進,無法保證每個新設計的蛋白質都具有所需的功能,但計算機可以生成數十或數百個有希望的候選結構進行嘗試。將所有這些結構轉化為基因序列將需要合成數十萬個 DNA 鹼基——使用當前技術這是一個困難且昂貴的命題,但在第一代生物工廠技術的觸及範圍內。
這些針對瘧疾和 HIV 的 DNA 和蛋白質合成專案說明了一種由生物工廠技術支援的方法,該方法可以應用於更廣泛的疾病,包括新出現的威脅。例如,透過結合高速、低成本的 DNA 測序方法[參見 George M. Church 的《人人都可擁有基因組》;《大眾科學》,1 月刊] 以及工廠的合成能力,可以對 SARS 等新型病毒或新型流感毒株進行表徵,並且可以比目前可能的速度更快地準備好針對它們的蛋白質疫苗。
當然,生物工廠不僅僅是一系列更快的合成技術的集合。它是一種思考現有生物機器和構建新生物機器的方式,借鑑了工程學的語言和方法論。
生物磚
2000 年,當時在普林斯頓大學的 Michael Elowitz 和 Stanislas Leibler,以及我們中的一位(Collins)與波士頓大學的同事 Tim Gardner 和 Charles Cantor 一起,用生物部件構建了第一個基本電路元件——環形振盪器和觸發開關。科學家們已經知道大約 25 年,天然生物體使用這種型別的電路來調節自身的基因,但我們兩個團隊的獨立努力代表了製造功能性人工生物電路的首次成功。
Elowitz 和 Leibler 的環形振盪器很好地說明了我們所說的術語,他們最初嘗試構建合成生物鐘,希望它能提供對生物系統中自然存在的生物鐘的深入瞭解。他們的基本電路包括一個稱為質粒的 DNA 環,其中包含三個基因:tetR、lacI 和 cI,它們分別編碼蛋白質 TetR、LacI 和 cI。為了將任何基因翻譯成蛋白質,酶聚合酶必須首先與位於基因上游的 DNA 鏈區域(稱為啟動子)結合。然後,聚合酶將基因轉錄為信使 RNA,信使 RNA 繼而被翻譯成蛋白質。如果聚合酶無法與啟動子結合,則基因不會被翻譯,蛋白質也不會被製造出來。
Elowitz 和 Leibler 安排他們電路中三個基因的蛋白質產物選擇性地結合到彼此的啟動子區域。因此,LacI 蛋白將結合 tetR 啟動子,而 cI 蛋白將結合 lacI 基因的啟動子,TetR 將結合 cI 基因的啟動子。這些相互關係使一個基因的蛋白質產物能夠阻止聚合酶與另一個基因的啟動子結合。因此,三種蛋白質的製造以振盪週期發生:大量的 LacI 蛋白抑制 tetR 基因活性;然後,TetR 蛋白的缺失允許 cI 基因被開啟,這具有抑制 LacI 產生的效果,依此類推。
當該迴圈中的一種蛋白質產物也與製造綠色熒光蛋白的基因連線,並且整個電路被插入細菌中時,可以觀察到該裝置的振盪,因為細菌像節日彩燈一樣閃爍。同樣,最新版本的 Collins 小組的基因觸發開關可用於程式設計細菌以檢測細胞 DNA 損傷,然後透過將它們自身排列成稱為生物膜的綠色熒光草坪來報告它們的發現。
關於這些合成生物電路,也許最引人注目的是,它們的功能與電子工程師在想要測試製造半導體晶片的新工藝時構建的第一種型別的電路相同。工程師們知道,諸如振盪器或開關之類的基本元件在邏輯上是完備的。能夠可靠且準確地構建這些簡單的部件,就使得設計和製造更復雜的電路成為可能。一旦生物工程師也能理所當然地接受這些基本構建塊,他們就可以繼續進行更復雜的專案,例如多細胞系統、二維和三維設計以及功能非生物的裝置。
我們中的一位(Weiss)最近為一種多細胞系統製作了一個原型,該系統可以用於例如檢測爆炸物或其他化學物質,然後用可見訊號報告它們[參見第 47 頁的方框]。這種生物機器使我們能夠用指令和協議對數百萬個細菌細胞進行程式設計,這些指令和協議既用於在執行命令時相互通訊,又用於以各種模式輸出光訊號。
受到這些早期例子的啟發,我們中的一位(Endy)與 Knight 和我們在麻省理工學院的同事 Randy Rettberg 一起,正在開發一個類似於晶片設計師可用的庫的生物元件庫。這個標準生物部件註冊庫應該有助於廣泛的生物構建專案,我們希望其他人也能貢獻新的條目。到目前為止,該註冊庫包含 1,000 多個單獨的生物磚,正如我們所稱的那樣,包括許多類似於電子裝置的部件,例如反相器、開關、計數器、放大器以及可以接收輸入或輸出顯示的元件。我們還定義了一個標準訊號載體——每秒聚合酶或 PoPS——類似於連線兩個電子元件的導線中的電流,以便生物工廠工程師可以更輕鬆地組合和重用基因裝置。
為了展示工廠方法的威力併為這個新領域播下種子,麻省理工學院小組在 2003 年開設了第一個使用生物部件進行工廠式工程的課程。該課程迅速發展成為一年一度的競賽,今年夏天將吸引來自 30 多所大學的團隊參加。在其短暫的存在期間,國際基因工程機器 (iGEM) 競賽已經產生了一些驚人的細胞裝置,包括可以記錄和顯示照片的生物膜,以及能夠像開關一樣感知小分子輸入(如咖啡因)並做出反應的程式化細胞。
我們中的三位(Smolke、Collins 和 Church)開發的另一個 iGEM 條目是一種能夠使用一系列 DNA 片段進行數字計數的裝置。20 個這樣的 DNA 位足以計數和報告多達一百萬 (220) 個細胞狀態。這項技術可以整合到感測器中,感測器又可以連線到工程代謝途徑,例如 Keasling 小組的青蒿素生產最佳化版本。這將使所需藥物的生產在字面上透過撥動開關即可增加。
構建合成生物學
當我們這篇文章的作者開始努力構建生物工廠時,尚無明確的方法可以準確、快速且廉價地製造長 DNA 構建體。今天,這只是生物工程不斷擴充套件的工具箱中的幾種技術之一。我們正在朝著首先在計算機中設計和建模生物裝置,然後在最後一步將它們切割成生物形式的方向發展——就像矽晶片的規劃然後蝕刻一樣。
與半導體電路一樣,這種方法還具有允許我們最佳化部件之間相互作用並預測錯誤的額外好處。隨著構建的系統變得越來越複雜,這種能力變得越來越有用。抽象設計的另一個優點是,生物工程師不需要從頭開始構建每個部件,甚至不需要知道每個部件如何在內部工作——只需要知道它們是否可靠地工作即可。
參加 iGEM 的學生可能代表了第一代從職業生涯一開始就接受培訓,將自己視為生物學家和工程師的人。然而,未來的一個重要挑戰將是讓更多的生物學家像矽工程師一樣思考(並吸引更多的工程師進入生物學領域)——尤其是在共享部件方面。到目前為止,生物技術的特點是自成一體的團隊致力於開發單一用途的應用程式,例如一種藥物化合物。生物技術的未來很大程度上將需要許多不同的團隊貢獻子系統。我們希望構建生物學工廠將促進這種發展,並有助於促進像半導體行業取得的革命性進步一樣的進步。
作者
生物工廠小組成員包括華盛頓大學的 David Baker、哈佛醫學院的 George Church、波士頓大學的 Jim Collins、麻省理工學院的 Drew Endy 和 Joseph Jacobson、加州大學伯克利分校的 Jay Keasling、杜克大學的 Paul Modrich、加州理工學院的 Christina Smolke 和普林斯頓大學的 Ron Weiss。他們是朋友、同事和不時合作者,他們作為一個小組撰寫了這篇文章,因為他們的專業知識的多樣性,以及他們對生物工廠工作的貢獻,體現了生物工程的跨學科性質。所有作者也是位於馬薩諸塞州劍橋市的 Codon Devices 的科學顧問,Codon Devices 是第一家應用工程原理於合成生物學的商業企業。Church、Endy、Jacobson 和 Keasling 是其創始人之一。Endy 也是非營利性 BioBricks 基金會的創始人,Keasling 創立了 Amyris Biotechnologies。
