蛋白質是生命的基本奈米機器,它為像我這樣的科學家創造奈米機器提供了許多經驗教訓。蛋白質是含有數百到數千個原子的大分子,通常跨度為幾奈米(十億分之一米)到幾十奈米。我們的身體包含至少 20,000 種不同的蛋白質,它們的功能包括使我們的肌肉收縮、消化食物、構建骨骼、感知環境以及不知疲倦地回收細胞內數百個小分子。
1986 年,當我還是化學本科生時,我夢想著設計和合成能夠完成蛋白質所做的驚人事情甚至更多事情的大分子(含有 100 多個原子的分子)的可能性。自 20 世紀 70 年代末第一批 TRS-80 計算機問世以來,我就一直在編寫計算機程式,我認為如果我能像編寫軟體一樣輕鬆地構建複雜的分子機器,那將是一件很棒的事情。我想為物質創造一種程式語言——軟體和化學的結合,使人們能夠描述奈米機器的形狀,然後確定化學家或機器人應執行以構建奈米器件的一系列化學過程。
不幸的是,透過設計新蛋白質來發明奈米機器的想法遇到了一個嚴重的障礙。每種蛋白質通常都從一個簡單的線性鏈開始,該線性鏈由從僅 20 種氨基酸的庫中提取的特定氨基酸序列組裝而成。到目前為止,一切都很好,但是蛋白質的特性以及它可以執行的功能取決於其形狀。在細胞中組裝氨基酸鏈後不久,它會透過稱為蛋白質摺疊的複雜過程,坍縮成螺旋和其他結構的複雜纏結。氨基酸序列決定了最終形狀,但是預測特定序列將呈現什麼形狀是科學和工程領域最重大的未解決挑戰之一(蛋白質摺疊問題)。
支援科學新聞報道
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您將幫助確保有關塑造我們當今世界的發現和想法的具有影響力的故事的未來。
在我第一次產生對未來的憧憬大約 20 年後,我的實驗室最終開發出了一種生產具有可程式設計形狀的大分子以及設計它們所需的計算機軟體的方法。我們的方法受到天然蛋白質模組化的啟發,但它不依賴於氨基酸鏈自發坍縮成形狀——因此它避免了與未解決的摺疊問題作鬥爭。
我們正在開發這項技術來創造可以執行特定功能的分子。我們的最初目標之一是創造感測器:當它們與特定的目標分子(例如葡萄糖、毒素或化學戰劑)結合時,會改變形狀和顏色的大分子。結合事件觸發感測器分子將兩個熒光基團擺動在一起,從而改變其顏色,從而發出樣品中存在目標的訊號。我們還在使用我們的技術來創造長的、鉸接的分子,這些分子響應外部訊號(分子執行器、分子閥門和計算機儲存器的創造步驟)而開啟和關閉。
我們設想我們的技術最終將導致一種更先進的構建奈米機器的方法:我們將使用它來製造複雜的奈米工具,例如裝配器,它像核糖體一樣負責構建細胞內的蛋白質,將在外部程式設計師的控制下組裝其他奈米機器。目前,第二個夢想仍存在於未來。
從自然中汲取教訓
1990 年我完成本科學習時,我認為開發奈米機器的途徑在於推匯出蛋白質摺疊的規則,並使用這些規則來開發新蛋白質。我加入了加州大學舊金山分校羅伯特·M·斯特勞德及其蛋白質晶體學小組。蛋白質晶體學家培養蛋白質晶體,並使用 X 射線來確定蛋白質原子的精確三維排列。使用這種工具,我對蛋白質結構的複雜性和美感有了深刻的認識。我花了四年時間創造了 4HB1,一種我自己設計的人工蛋白質。我首先組裝了一個人工基因,然後將其插入細菌中,細菌表達了它——也就是說,製造了基因 DNA 編碼的蛋白質。接下來,我結晶了所得蛋白質並確定了其 X 射線晶體結構。令人興奮的是,我發現 4HB1 具有我設計的構象!
然而,經過所有這些工作,4HB1 只是一個分子門擋。除了作為一種良好摺疊的人工蛋白質存在之外,它什麼也沒做。最令人不安的是,這次經歷並沒有揭示我創造所需形狀的其他蛋白質所需的簡單規則。相反,蛋白質摺疊的複雜性表明,這種簡單的規則可能不存在。在 1997 年完成我的博士學位時,我得出結論,創造定製設計的奈米機器的更好方法是從一組有限的模組化構建模組中構建它們,這些模組不會透過蛋白質的摺疊過程獲得其形狀。
這不是一個新想法。1995 年,德克薩斯大學奧斯汀分校的布倫特·艾弗森開發了可以連結成稱為寡聚物的短聚合物的構建模組。然後,這些寡聚物會自組裝成褶皺結構,因為富電子供體基團會拉動結構中的缺電子受體基團。
大約在同一時間,威斯康星大學麥迪遜分校的薩姆·蓋爾曼和蘇黎世瑞士聯邦理工學院的迪特·塞巴赫正在開發稱為 β-肽的合成分子,β-肽是 β-氨基酸的柔性鏈——β-氨基酸是大多數非天然存在的分子,其一般結構與常規氨基酸(α-氨基酸)略有不同。蓋爾曼和塞巴赫的短 β-肽摺疊成扭曲的螺旋。
這些構建具有特定形狀的大分子的新方法令人鼓舞,但它們似乎用另一個摺疊問題換取了一個摺疊問題。困難在於,天然蛋白質和這些新分子涉及由單鍵連線的分子鏈,這些單鍵使結構在其整個長度上具有很大的彎曲自由度。這些分子之一在獲得最終形狀時如何彎曲取決於當沿著鏈條的所有不同構建模組靠得更近時產生的吸引力和排斥力的複雜相互作用。
我心中有一個更激進的方法。我想完全消除通常的摺疊過程,從而更好地控制最終產品的形狀。為了實現這個目標,我著手發明剛性構建模組,這些模組可以透過成對的鍵相互連線,以建立剛性的、梯子狀的大分子。這個想法以前有人嘗試過:1987 年,當時在英國謝菲爾德大學的 J·弗雷澤·斯托達特透過從構建模組建立分子帶和項圈,引入了分子樂高積木的概念。
我加入了哈佛大學格雷戈裡·維爾丁的實驗室,學習合成有機化學。在合成非天然氨基酸和尋找實現我更大願景的途徑的兩年裡,我偶然發現了一篇描述一種名為二酮哌嗪的化學結構的論文。在這種結構中,六個原子連線成一個包含兩個醯胺鍵的環[參見下一頁的方框]。醯胺鍵是將蛋白質組成氨基酸連線在一起形成鏈的鍵,就像一排人手牽著手一樣。當兩個氨基酸像兩個人面對面並牽著雙手時,它們的胳膊形成一個閉環時,就會出現二酮哌嗪。合成蛋白質的化學家已經開發出許多優異的氨基酸之間形成醯胺鍵的反應,他們都非常熟悉二酮哌嗪結構,因為它會在不需要時形成並干擾他們合成蛋白質的努力。不過,我認為我可以利用二酮哌嗪的形成來連線我的構建模組。
這個想法的其餘部分很快就到位了。在人的類比中,氨基酸的兩條臂是僅由幾個原子組成的基團,稱為胺基和羧基。(然而,與手臂不同,這些基團實際上並沒有伸出很遠。)將一個視為左臂,另一個視為右臂,醯胺鍵是左手握住右手。我的每個新構建模組或單體都像兩個人剛性地捆綁在一起(例如,背靠背),他們的手臂放在他們面前。一個單體將透過一個人握住另一個人的雙手與序列中的下一個單體連線——形成一個二酮哌嗪環。
在真實的化學術語中,每個單體將由一個主要由碳原子組成的剛性分子組成,其中集成了兩個氨基酸基團,並且兩個氨基酸的胺和羧基都可用於與其他單體結合。兩個單體將透過每個單體上的氨基酸基團反應在一起形成二酮哌嗪環而連線。我們將把這種單體稱為雙氨基酸(雙表示兩次),因為每個單體都包含兩個氨基酸。正如氨基酸鏈被稱為肽一樣,我們將把我們的雙氨基酸鏈稱為雙肽。
從頭開始
有了構建模組集合的藍圖,我在匹茲堡大學建立了一個新實驗室,我的學生和我可以在那裡開發合成化學來使這個想法奏效。在兩年內,我的第一批研究生之一克里斯託弗·萊文斯合成了我們的第一個雙氨基酸。他從羥脯氨酸開始,羥脯氨酸是膠原蛋白(使軟骨、韌帶和肌腱強壯的蛋白質)的商業上可獲得的成分,另一個小組以前曾將其用於製造非常像我們單體設計的分子。萊文斯使用我們共同制定的九步配方,將羥脯氨酸轉化為四種構建模組,我們將其命名為 pro4(2S4S)、pro4(2S4R)、pro4(2R4S) 和 pro4(2R4R)。我們稱它們為 pro4,因為它們都類似於氨基酸脯氨酸,並在碳 4 上安裝了一個額外的氨基酸(化學家透過以系統的方式用數字標記有機分子中的碳原子來識別它們)。標籤 S 和 R 表示連線到碳 2 和碳 4 的基團的取向。完成的構建模組是乾燥的粉末,在室溫下可穩定儲存數月。
我們構建我們的單體構建模組,其中胺上附著保護基團(以防止醯胺鍵在我們需要它們之前形成),並且其中一個羧基以改性的、反應性較低的形式稱為酯。為了合成雙肽,我們以單鍵將構建模組按所需順序組裝起來,然後連線所有第二鍵,使分子剛化成最終形狀[參見對面頁面的方框]。萊文斯執行了這個由兩部分組成的過程,以構建我們第一個由 pro4 單體組成的短結構。
連線過程的第一部分使用一種稱為固相支援合成的技術。它從塗有胺基的塑膠珠開始。第一個構建模組上的羧基與胺之一形成醯胺鍵,將構建模組固定到珠子上。使用過量的構建模組可確保珠子上的幾乎所有胺都附著了一個構建模組。用溶劑快速洗滌可去除副產物和剩餘的構建模組。然後用鹼洗滌去除新新增的構建模組上的兩個胺之一上的保護基團(兩個胺具有不同的保護基團,因此僅剝離其中一個)。新增第二個構建模組,並透過其羧基和暴露的胺基與第一個構建模組連線。然後從其胺之一中去除保護,新增第三個構建模組,依此類推。
這種構建過程進行得很慢:新增每個連續的單體大約需要一個小時,因為我們必須等待足夠長的時間,以便幾乎所有暴露的胺都獲得它們的構建模組。幸運的是,通常用於合成肽的機器人可以自動化這項工作,並且可以輕鬆地並行構建許多序列。
當鏈完成時,我們使用強酸去除珠子,然後從鏈中每個構建模組中剝離第二個胺保護基團。新增鹼溶液會導致每個構建模組上新暴露的胺攻擊前一個構建模組上的酯,並形成另一個醯胺鍵。由於兩個醯胺鍵連線每對相鄰的構建模組,因此整個分子現在是剛性的,並且具有可預測的、明確定義的形狀。
我們很快發現雙肽可溶於水和其他極性有機溶劑(易於與水混合的溶劑)。雙肽的水溶性使其易於研究,並表明我們可以使用它們來開發必須能夠分散在血液中的新藥。
程式設計形狀
構成我們雙肽的雙氨基酸像形狀奇特的樂高積木一樣連線在一起。特別是,每個雙氨基酸的行為都像一塊磚塊,其頂面上的凸起相對於其底面上的孔是傾斜和扭曲的。重複將一種型別的磚塊堆疊在自身之上,您可以製作一個彎曲的形狀,曲線的具體形狀取決於選擇哪種雙氨基酸。僅使用兩種不同型別的磚塊以不同的順序堆疊,您可以製作 2N 種不同的形狀(N 是堆疊中磚塊的數量)。一個由我們的四種 pro4 雙氨基酸製成的 10 個嵌段長的雙肽可以具有大約一百萬種 (410) 形狀中的任何一種。我們擁有的構建模組形狀越多,我們就越能更好地控制大分子的最終形狀。然後,挑戰在於設計和合成那些具有有用功能的序列。
設計具有特定形狀的雙肽的關鍵是瞭解我們的各個雙氨基酸在相互連線時呈現的精確形狀。這些資訊,類似於瞭解每塊磚塊的大小及其凸起的傾斜度和扭曲度,將成為我們物質程式語言的基礎。在合成了我們的第一個雙肽後,我們就可以進行測量以確定它們的碎片如何組合在一起。
我們進行了核磁共振實驗,以找出雙肽上的哪些氫原子彼此靠近,並應用其他技術來測量碳-氫鍵的取向。從這些測量結果中,我們推斷出我們需要的形狀資訊,並使用它建立了一個用於構建雙肽的計算機輔助設計程式,稱為 CANDO(computer-aided nanostructure design and optimization 的縮寫)。
格雷戈裡·伯德,我實驗室的另一位研究生,使用 CANDO 設計了分子棒和彎曲結構。最近,他組裝了這些結構,在每個序列的每一端附著一個稱為自旋探針的化學基團,以驗證反應容器中的結果與計算機中的設計是否匹配。事實上,pro4(2S4S) 和 pro4(2R4R) 構建模組的序列具有 C 形和 S 形,正如 CANDO 預測的那樣。
pro4 組雙氨基酸就像傾斜度相對較小的樂高積木,因此我們可以使用它們來製作棒狀和輕微彎曲的形狀,這些形狀可以像支柱一樣將化學基團以特定的距離隔開。然而,蛋白質的許多有用功能是由於可以用於將蛋白質與特定靶標結合或容納分子並催化反應的腔體而產生的。為了創造具有合適腔體的緊湊型雙肽,我們需要擴大我們的構建模組庫。我的學生斯蒂芬·哈貝朝著這個目標邁出了第一步,他開發了一種我們稱之為 hin 的雙氨基酸,它在雙肽中創造了一個急轉彎。
我們的單體集合逐年增長,CANDO 分析表明,我們目前的 14 個單體的庫足以創造包含腔體的緊湊型雙肽。但是,隨著我們開發新的構建模組並將它們納入雙肽中,我們遇到了一個問題。形成剛化第二醯胺鍵的反應在 pro4 單體之間非常迅速,但對於我們所有的新構建模組來說都很緩慢。提高反應溫度加快了速度,但打亂了最終形狀。這個問題是創造更大更復雜的雙肽的巨大障礙。
我的學生沙拉德·古普塔透過開發一種關閉第二醯胺鍵的新方法部分克服了這一挑戰。在每個單體上,他將酯改為更易受胺攻擊的酯,並且受到 20 世紀 70 年代一篇論文的啟發,他使用了乙酸作為催化劑而不是鹼。熱和酸的結合加速了環閉合反應,而不會像熱和鹼那樣打亂我們的雙肽形狀。
我們花了六個月的時間才找到我們目前確定的酯、保護基團、溶劑和溫度的組合,但我們將來會回到這個問題,因為我們的解決方案對於長度超過約五個單體的序列效果不佳。與此同時,我們專注於開發一些我們可以高效生產的雙肽的應用——任何長度的僅涉及 pro4 單體的雙肽,以及最多包含其他單體的五個單體的序列。
開發應用
我們為雙肽追求的首批應用之一是一種可以與霍亂毒素蛋白 (Ctx) 緊密結合的大分子。該蛋白質具有五個相同的口袋,每個口袋都位於五邊形的角上。這些口袋使 Ctx 能夠與糖 GM1 結合,GM1 恰好適合這些口袋。排列在小腸內壁的上皮細胞表面附著有 GM1 分子,當 Ctx 與這些分子中的五個結合時,它會引發導致危及生命的腹瀉疾病的一系列事件。與 Ctx 上這些口袋緊密結合的分子可以阻止毒素與人體細胞結合,並阻止疾病的發生。
其他研究人員已經開發出可以單獨與這些口袋結合的小糖。但是這些藥物效果不佳,因為它們與 Ctx 的結合不夠緊密,並且無法與 Ctx 與人體細胞上的 GM1 產生的五種同步相互作用競爭。我們想知道我們是否可以合成一種雙肽,它可以同時將糖插入兩個口袋中。我們幾乎可以在雙肽的末端附著任何我們想要的東西,因此對於此應用,我們在棒狀雙肽的每一端都放置了一個小糖,該雙肽恰好跨越 Ctx 蛋白中相鄰口袋之間的距離。實驗表明,帶有兩個糖的雙肽比單個小糖與 Ctx 結合得更緊密,並且它們至少與天然 GM1 靶標結合得一樣好。
然而,我們一直無法確定每個雙肽是與一個 Ctx 的兩個口袋結合,還是與兩個不同 Ctx 分子上的口袋結合,從而建立一個 Ctx 分子的交聯網路。交聯 Ctx 不是對抗霍亂的有效方法,因為它僅對體內已經有很多 Ctx(可能是致命量)的人有效。(如果 Ctx 濃度太低,則每個雙肽可能與一個 Ctx 上的一個口袋結合,但隨後遇到另一個 Ctx 以建立交聯的機會太小。)但是交聯病毒表面的蛋白質可能有效,因此我們現在正在將這種方法應用於抑制病毒,包括 HIV 和埃博拉病毒。
除了將基團附著到剛性棒的末端外,我們還開發了分子執行器,其中兩個棒由鉸鏈連線。執行器是一種透過產生運動來響應訊號的裝置。我們的棒-鉸鏈-棒執行器設計為通常開啟,並在棒外端的基團結合金屬或小分子時摺疊或關閉。我的學生勞拉·貝拉斯科製作了我們的第一個版本,其中棒長四個構建模組,鉸鏈是一個普通的氨基酸,金屬觸發開啟和關閉。一種應用將是分子閥門[參見對面頁面的方框]。閥門將由一個奈米孔組成,其邊緣周圍附有鉸接棒。伸出的棒將阻塞孔;摺疊後,它們將開啟孔。這些閥門可用於製造一種裝置,該裝置可以感知患者的病情並釋放適當的藥物作為響應。
開啟和關閉的控制可以透過電子方式進行,方法是在棒的末端放置基團,這些基團會在存在正確電荷時結合。如果可以以這種方式單獨控制鉸接棒,則可以由鉸接棒森林製成計算機儲存裝置。原子力顯微鏡尖端將掃描森林的行,檢測哪些棒直立作為 1 和 0,類似於檢測 IBM Millipede 驅動器的凹坑或無凹坑。擦除凹坑對於 Millipede 系統來說很困難,但對於鉸接棒來說,只需反轉鉸接棒的狀態即可。
生物體用來構建蛋白質的 20 種氨基酸的側鏈上裝飾有各種化學基團。蛋白質將這些化學基團定位在構型中,其形狀和其他特性用於催化反應、結合小分子並執行其許多功能。同樣,在我們的實驗室中,我們正在開發帶有附加化學基團的構建模組,這將使我們能夠建立在其梯子狀骨架上顯示化學基團的雙肽。到目前為止,我們已經制造了第一個帶有側基的此類構建模組。如果我們能夠製造具有化學基團星座的大分子,這些大分子可以模擬酶的活性位點——催化發生的區域——我們可以使用它們來學習如何創造設計酶。
我設想在 20 年後,將會有一個活躍的開發者社群:數十個小組發明基於設計雙肽的大分子,並學習如何生產人工酶和其他有用的分子裝置。目前,一些有希望的抗癌藥物,如哈利克隆菌素-B 和苔蘚抑素,合成成本非常高昂。生產這些化合物的稀有海綿和海洋生物無法提供廣泛使用所需的數量。20 年後,我們或許能夠創造出人工酶,以環境友好的方式高效合成這些化合物和其他有價值的化合物。想象一下,在裝滿高果糖玉米糖漿的桶中滴一滴人工酶,幾天後收穫數加侖的苔蘚抑素。
如果我們能夠開發出能夠將植物纖維素分解為乙醇或利用光能將水和二氧化碳結合起來產生乙醇的人工酶,那麼這項事業將為社會帶來巨大的好處。我們甚至可以設計人工酶來合成我們的雙氨基酸構建模組並將它們連線在一起,從而更容易製造雙肽。
我們開發了一種化學和軟體的組合,用於創造具有可程式設計形狀的大分子。由於生產雙肽僅需幾天時間,因此我們可以在幾周的時間尺度內設計和組裝它們、測試它們的特性並塑造下一代。未來幾年引人入勝的挑戰將是如何從一個功能開始,並設計出最適合執行該功能的雙肽序列。
作者
克里斯蒂安·E·沙夫梅斯特是天普大學的化學副教授,他在那裡開發形狀可程式設計分子。他於 1997 年在加州大學舊金山分校獲得生物物理學博士學位。作為哈佛大學的博士後研究員,他開發了一種使肽更耐蛋白酶的新方法,使其更適合作為潛在藥物。他是為加利福尼亞州帕洛阿爾託市遠見奈米技術研究所編寫生產性奈米系統技術路線圖的工作組成員。