在馬薩諸塞州沃爾瑟姆市一棟混凝土建築二樓一個普通的實驗室冰櫃裡,放著一個塑膠盒,裡面裝著一個透明的試管,裡面裝著一種天文數字比例的混合物。冷凍在其中的化學物質庫,是倫敦製藥公司葛蘭素史克(GSK)擁有的化合物集合,包含多達1萬億個獨特的DNA標記分子——是銀河系中恆星數量的十倍。
這個和其他類似的庫正在幫助製藥公司和生物技術公司快速識別可以與疾病相關的蛋白質結合的候選藥物,特別是那些已被證明難以靶向的蛋白質。它們使得篩選的進行速度更快、成本更低,遠勝於傳統方法。學術科學家也可以利用它們來探索基礎生物學問題,並研究酶、受體和細胞通路。
藥物發現通常始於研究人員組裝大量的化學物質庫,然後針對目標蛋白質進行測試。將化合物單獨新增到含有靶標的孔中,以檢視它們是否會影響其活性。這種方法稱為高通量篩選(HTS),它使用機器人裝置實現自動化,可以測試數百萬種化學物質,但它仍然費力、昂貴,而且並不總是成功。
支援科學新聞報道
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道: 訂閱。透過購買訂閱,您正在幫助確保關於塑造我們當今世界的發現和思想的有影響力的故事的未來。
在過去的幾年裡,藥物化學家透過用條形碼式的DNA片段標記化合物,增加了發現潛在有用化合物的可能性。這些DNA編碼庫——可以超過傳統的的小分子庫——為藥物發現提供了各種優勢。首先,研究人員可以將所有DNA標記的小分子放入單個混合物中,而不是單獨測試每種化合物,然後引入目標蛋白質。任何與目標結合的化合物都可以透過其DNA條形碼輕鬆識別。
DNA編碼庫最早於1992年由分子生物學家悉尼·布倫納和化學家理查德·勒納提出,他們在加利福尼亞州拉霍亞的斯克裡普斯研究所進行了一項思想實驗。從那時起,它們一直在發展壯大。2007年,葛蘭素史克以5500萬美元收購了沃爾瑟姆市的一家開創這些庫的公司Praecis Pharmaceuticals。位於瑞士巴塞爾的製藥公司諾華和羅氏也已經啟動了自己的內部DNA編碼庫專案。與此同時,一個新興的生物技術公司群體——包括沃爾瑟姆的X-Chem、哥本哈根的Vipergen、馬薩諸塞州劍橋的Ensemble Therapeutics和瑞士蘇黎世的Philochem——已經建立了一個渴望使用該技術的行業和學術合作伙伴名單。
“人們現在明白這並不是一種潮流,”馬薩諸塞州波士頓阿斯利康化學創新中心執行主任羅伯特·古德諾說,該中心與X-Chem合作。“這是真的。”
DNA編碼庫不會取代高通量篩選:公司已經在高通量篩選上投入了大量資金,而且有些化合物無法使用DNA編碼技術合成。相反,它們提供了一種互補的方法,可以快速、高效且廉價地找到與新的或歷史上具有挑戰性的靶點結合的化學結構,例如泛素連線酶,它可以標記蛋白質以進行處理,並可能在癌症治療中發揮作用。
大就是美
葛蘭素史克目前擁有世界上最大的DNA編碼庫:它比該公司擁有200萬種化合物的高通量篩選庫大50萬倍,令人印象深刻。
有幾種方法可以構建DNA編碼庫:最大的庫,如葛蘭素史克的庫,是使用一種稱為“DNA記錄”的方法構建的。化學構件,如氨基酸、胺和羧酸,被合成,然後透過化學反應用獨特的DNA條形碼標記。將第二個構件新增到混合物中以製造新的小分子,然後延長DNA條形碼。透過連線多達四個模組,化學家可以創造出類藥物分子。而且由於他們有數千個構件可以使用,潛在的組合數量是巨大的。
與傳統的需要化學家單獨測試每種化合物的高通量篩選庫相比,DNA編碼庫更易於維護和使用。DNA編碼庫可以儲存在一個試管中,而高通量篩選庫需要足夠大的機器人填充設施來單獨儲存每種化合物。
但葛蘭素史克在沃爾瑟姆的經理克里斯·阿里科-穆恩德爾說,DNA編碼庫的真正美妙之處在於它可以合成的化學結構數量之多。該公司的藥物發現團隊現在使用DNA編碼庫的頻率與高通量篩選庫一樣頻繁,如果不是更頻繁的話,用於新的和難以靶向的蛋白質目標。迄今為止,該公司DNA編碼庫中最先進的化合物是GSK2256294,它可以阻斷環氧化物水解酶,這是一種參與分解脂質的酶。這種候選藥物來自葛蘭素史克與Praecis的合作,並已完成首次人體安全性研究,這些研究可能支援進一步評估其在糖尿病、傷口癒合或作為慢性阻塞性肺疾病的治療中的應用。“我們對DNA編碼庫在葛蘭素史克內部的進展感到滿意,”阿里科-穆恩德爾說。
隨著越來越多的化學構件被創造出來,以及將它們彼此連線的更多方法,這些庫的廣度將繼續擴大。
X-Chem執行長理查德·瓦格納說,在不久的將來,DNA編碼庫不僅會變得更大更廣,還可能提供可以快速進入臨床試驗的靶點。在傳統的篩選中,藥物化學家有時必須花費多年時間來調整化合物,使其具有足夠的特異性、效力和安全性,才能進入臨床試驗。“這只是一場機率遊戲,”瓦格納說。相比之下,DNA編碼庫的大尺寸意味著,偶然地,它們所包含的一些化合物將比其他化合物更適合臨床使用。儘管化合物仍需要最佳化,“我們可以得到非常接近的東西”,他說。
X-Chem在其DNA編碼庫中擁有1200億種化合物,該公司已經開始在實踐中看到這一點。該公司僅用了一年的時間就將其最先進的候選藥物——一種阻止一種磷脂轉化為另一種磷脂的自吐酶抑制劑——從篩選靶點推進到了臨床候選藥物。X-Chem的一家衍生公司X-Rx位於北卡羅來納州威明頓,該公司計劃於2017年開始對該化合物進行纖維化臨床試驗。業界對X-Chem的庫的興趣正在蔓延:在過去的五年裡,該公司與包括羅氏、阿斯利康、拜耳、強生、輝瑞和賽諾菲在內的幾家大型製藥公司,以及許多生物技術和學術合作伙伴建立了合作和許可協議。
按需定製
其他生物技術公司增加了一個有趣的轉折。它們不僅使用DNA標籤來識別化合物,還將其用作製造化合物的模板。哈佛大學化學家大衛·劉和他的學生開發了這種“DNA模板化”方法,並用它構建了一個名為大環分子的環形分子庫。這些更大、更穩定的環形分子在多個位點與靶標相互作用,增強了結合反應的特異性。(葛蘭素史克和X-Chem也在其DNA編碼庫中擁有大量的大環分子集合。)
劉首先建立了充當嚮導的單鏈DNA模板——這些模板由與他的化學構件上的DNA標籤互補的幾個區域組成。然後,他按順序將DNA標記的構件新增到反應容器中,依靠DNA鹼基配對來物理地將標記的構件足夠靠近在一起以彼此結合。然後,最後一步反應將一連串的構件轉化為環,產生每個都與獨特的DNA條形碼相連的大環分子。
構建DNA模板化庫涉及大量的工作,因為研究人員必須為每個分子設計一個模板,並用DNA標記數千個構件。因此,DNA模板化庫比DNA記錄庫小,但它們在尺寸方面仍然超過了高通量篩選庫,並且它們也有其他優勢。由於科學家從一開始就知道他們正在生產什麼化合物,他們可以純化DNA模板化庫,以去除標記不準確的化合物。這一步驟轉化為對靶點的高度信任。相比之下,巨大的DNA記錄庫可能仍然包含錯誤標記的化合物,因此可能會產生一些會使研究人員進行徒勞無功的追逐的靶點。
劉的14,000個分子的庫已經取得了一些勝利。2014年,他的團隊報告說,當他們發現一種可以阻斷與2型糖尿病相關的胰島素降解酶(IDE)的特異性和穩定的小分子時,他們解決了研究人員數十年來一直在努力解決的問題。他和其他人已經開始揭示IDE在健康和疾病中的作用,這導致了其他IDE抑制劑的鑑定。目前正在討論將其開發成藥物。
劉還篩選了100多個其他靶點,其中許多是由需要他們感興趣的蛋白質的小分子抑制劑的學術合作者帶給他的。“我從來沒有想到七年後,第一代庫仍然會為我們提供有趣的生物學發現,”他說。“但它已被證明是非常富有成效的。我們從我們的第一個庫中獲得的靶點比我們能夠跟進的還要多。”
然而,他正在完成第二代256,000個大環分子的庫的最後潤色,這可能會開啟更多的生物學研究。劉於2004年創立的Ensemble Therapeutics公司現在在其庫中擁有超過1000萬個大環分子。該公司專注於免疫檢查點蛋白質(調節免疫系統)和泛素連線酶中的靶點。它還授予了諾華公司一項許可,以開發其發現的其中一種分子,該分子靶向與炎症相關的蛋白質白細胞介素-17。
甜蜜篩選
一旦構建好化合物庫,接下來有趣的事情就開始了,那就是找出哪些分子會粘附到靶標上。大多數研究人員依賴於“親和力篩選”來尋找這些化合物。為此,他們會對蛋白靶標進行改造,使其包含一個純化標籤。然後,他們將包含化合物庫和靶標的混合物透過純化柱,利用純化標籤將結合的配對物拉出。最後一步是使用 DNA 測序儀讀取與小分子連線的 DNA 識別符號。
即使只有極少量的靶蛋白,這種方法也能產生結果。Arico-Muendel 回憶說,在一個專案中,學術合作者希望篩選一種不穩定的蛋白質,他們只能少量生產。“他們把它放在乾冰中連夜運到這裡,我們立即對它進行了整個篩選,”他說。“結果確實得到了一些非常好的命中。”這種實驗對於高通量篩選 (HTS) 來說是不可能實現的,因為靶蛋白必須足夠穩定和豐富,才能在實驗開始前新增到數百萬個孔中。
但是,基於親和力的篩選也有其缺點。笨重的 DNA 標籤有時會阻礙與靶標的相互作用,並且可能會丟失一些潛在的候選物。但是,由於 DNA 編碼的化合物庫非常龐大,篩選人員通常不會太擔心這些損失。更成問題的是,小分子及其標籤可能會結合到純化柱上,從而產生假陽性命中。純化標籤也可能干擾靶蛋白的結構,從而給資料引入混淆。
一些研究小組已經開發出解決這個問題的方法。Vipergen 是一家生物技術公司,擁有一種含有 5000 萬個分子的 DNA 模板化合物庫,該公司將希望寄託在“結合劑捕獲富集”策略上。
該公司執行長 Nils Hansen 說,想象一下,你可以凍結你的蛋白質-化合物庫混合物,並將其切成超小的冰塊。如果冰塊足夠小,每個冰塊將只能包含單個靶蛋白。在這種大小下,即使沒有純化策略,結合靶標的小分子也會在包含靶標的冰塊中始終過度表達。Vipergen 透過將其篩選放入水油乳液中實現了相同的效果,其中微小的水滴代替了冰塊。“這很酷,”Hansen 說。
目前,DNA 編碼的化合物庫篩選最適合自由漂浮的可溶性蛋白質。但是,許多有吸引力的藥物靶標都嵌入細胞表面,這使得它們無法使用傳統的基於親和力的篩選方法進行探測。例如,據估計,40% 的已批准藥物靶向膜結合 G 蛋白偶聯受體,這些受體感知細胞外的分子。Goodnow 說,用於篩選膜結合蛋白的技術正在發展,“但仍然是一種挑戰”。
一種前進的方法是將 DNA 編碼的化合物庫與過度表達膜結合靶標的完整細胞混合。然後,小分子可以結合到細胞表面的靶標上。在研究人員洗去未結合的化合物庫後,他們可以透過加熱細胞並讀取洗脫的 DNA 標籤來識別結合的小分子命中。葛蘭素史克公司已經使用這種方法來識別一種與精神分裂症和中樞神經系統疾病有關的受體的強效抑制劑。
X-Chem 也開始在膜結合蛋白的篩選中取得成功。“從歷史上看,我們的大部分專案都是針對可溶性蛋白質的。但是,鑑於我們最近能夠從非常困難的膜結合蛋白中產生的資料,情況正在發生變化,” Wagner 說。
隨著 DNA 編碼的化合物庫不斷擴大,以及新的篩選方法開闢了未知的生物空間,他補充說,“DNA 編碼的化合物庫有望成為製藥行業發現的支柱之一。”
本文經許可轉載,並於 2016 年 2 月 18 日首次發表。
