有許多原因導致有前景的藥物在藥物開發過程中被淘汰,其中之一是細胞色素P450。CYP450是一組主要在肝臟中產生的酶,通常被稱為CYP450,它參與分解化學物質並防止它們在血液中積累到危險水平。事實證明,許多實驗性藥物會抑制CYP450的產生——這是一個令人煩惱的副作用,可能使這種藥物對人體有毒。
長期以來,製藥公司一直依賴傳統工具來預測候選藥物是否會抑制患者體內的CYP450,例如在試管中進行化學分析,觀察CYP450與化學性質相似、瞭解更充分的藥物之間的相互作用,以及對小鼠進行測試。但他們的預測大約有三分之一的時間是錯誤的。在這些情況下,與CYP450相關的毒性可能只在人體試驗期間才會被發現,導致數百萬美元和多年的努力付諸東流。這種代價高昂的不準確性有時會讓人感覺像是“我們存在的禍根”,百時美施貴寶公司研發和轉化醫學高階副總裁 Saurabh Saha 說道。
諸如此類的低效率導致了一個更大的問題:價值 1 萬億美元的全球製藥行業至少二十年來一直處於藥物開發和生產力下滑的狀態。製藥公司投入的資金越來越多——10 大製藥公司現在每年支付近 800 億美元——但成功研發的藥物卻越來越少。十年前,研發方面的每一美元投資都能獲得 10 美分的回報;而今天,回報率不到 2 美分。部分原因是,最容易找到、能夠安全有效地治療常見疾病的藥物都已被發現;剩下的工作是尋找能夠解決複雜且難以捉摸的問題的藥物,以及治療僅影響極小部分人口的疾病的藥物——因此可能獲得的回報要少得多。
關於支援科學新聞報道
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道: 訂閱。透過購買訂閱,您將有助於確保未來能夠繼續講述關於塑造我們當今世界的發現和想法的具有影響力的故事。
由於尋找新的、成功的藥物變得如此困難,根據塔夫茨藥物開發研究中心的資料,2003 年至 2013 年間,將一種藥物推向市場的平均成本幾乎翻了一番,達到 26 億美元。同樣的挑戰也使從實驗室到市場的時間線延長至 12 年,90% 的藥物在人體試驗的某個階段被淘汰。
因此,難怪製藥行業對用於藥物開發的人工智慧工具充滿熱情。這些工具的工作原理不是將專家開發的分析技術程式設計到其中;而是使用者向其輸入樣本問題(分子)和解決方案(分子最終作為藥物的行為方式),以便軟體可以開發自己的計算方法來生成相同的解決方案。
大多數基於人工智慧的藥物發現應用都採用一種稱為機器學習的技術形式,包括一種稱為深度學習的方法子集。大多數機器學習程式可以處理組織和標記的小型資料集,而深度學習程式可以處理原始的非結構化資料,並且需要更大的資料量。因此,一個機器學習程式在被展示數萬張細胞照片(其中各個部分已被標記)的示例後,可能會學會識別細胞的不同特徵。深度學習版本可以從未標記的細胞影像中自行找出這些部分,但它可能需要檢視數百萬張才能做到這一點。
該領域的許多科學家認為,人工智慧最終將透過以下幾種方式改進藥物開發:識別更有希望的候選藥物;提高“命中率”,即透過臨床試驗並獲得監管部門批准的候選藥物的百分比;以及加快整個過程。例如,百時美施貴寶公司最近部署的一個機器學習程式經過訓練,可以找到與 CYP450 抑制相關的資料模式。Saha 說,該程式將其 CYP450 預測的準確率提高到 95%——與傳統方法相比,失敗率降低了六倍。這些結果有助於研究人員快速篩選出潛在的有毒藥物,而將精力集中在更有可能透過多次人體試驗並獲得美國食品和藥物管理局批准的候選藥物上。“人工智慧可以發揮巨大作用的地方在於,讓藥物在早期就失敗,在我們對它們進行所有投資之前,”禮來公司首席資料和分析官 Vipin Gopal 說道。
現在,資源正湧入該領域。基於人工智慧的藥物發現初創公司在 2018 年籌集了超過 10 億美元的資金,截至去年 9 月,它們有望在 2019 年籌集 15 億美元。每一家主要的製藥公司都宣佈與至少一家這樣的公司建立了合作伙伴關係。然而,實際上只有少數人工智慧發現的藥物正在人體測試管道中,並且沒有一種藥物開始進行 3 期人體試驗,這是實驗性藥物的黃金標準測試。Saha 承認,還需要幾年時間他才能確定該公司的命中率是否會因人工智慧預測 CYP450 抑制率而提高。儘管行業內大肆宣傳,但早期結果是否會轉化為更多更好的藥物還遠未確定。
圖片來源:坎貝爾醫學插畫
篩選數百萬個分子
新興的人工智慧程式並非藥物行業的革命性更新,該行業長期以來一直在構建複雜的分析解決方案來輔助藥物開發。十多年前,隨著生物資訊學領域的發展——即尋求使用計算工具從大量資料中獲得生物學見解——強大的統計和生物物理建模程式的興起,催生了可以預測分子特性的工具。但這些程式受到了科學家對分子相互作用的不完全理解的限制:當科學家不知道資料中的哪些要素最重要以及它們如何相互關聯時,它們無法告訴傳統軟體如何在資料中找到見解。由於具有推匯出自身對哪些資料要素重要的見解的能力,較新的 AI 程式可以為更廣泛的變數提取更好的預測。
人工智慧工具透過多種方式解決藥物發現的不同方面。例如,一些人工智慧公司專注於設計一種能夠安全有效地作用於已知靶點的藥物——通常是一種特定的、經過充分研究的、與疾病相關的蛋白質。目標通常是提出一種分子,該分子可以化學結合到靶蛋白並對其進行修飾,使其不再導致疾病或其症狀。加拿大公司 Cyclica 將其軟體用於將數百萬個分子的生物物理結構和生化特性與約 15 萬個蛋白質的結構和特性進行匹配,以發現可能與靶蛋白結合的分子,以及需要避免的分子。
但作為藥物的良好候選分子仍然必須跳過其他障礙。這些障礙包括:穿過腸道進入血液,而不會立即被肝臟或代謝過程分解;在特定器官(如腎臟)中發揮作用,而不會擾亂其他器官;避免與人體內數千種對健康重要的其他蛋白質結合並使其失活;以及在藥物水平變得可能危險之前分解並離開人體。Cyclica 的人工智慧軟體考慮了所有這些要求。“一種可以與蛋白質靶點相互作用的分子通常可以與多達 300 種蛋白質相互作用,”Cyclica 執行長 Naheed Kurji 說。“如果您正在設計一種分子,您有必要考慮其他 299 種可能對人體產生災難性影響的相互作用。”
生物醫學研究人員越來越認識到,癌症和阿爾茨海默病等複雜疾病涉及數百種蛋白質,僅針對其中一種蛋白質不太可能產生足夠的破壞性。Kurji 解釋說,Cyclica 正在嘗試尋找可以與數十種靶蛋白相互作用,但避免與數百種其他蛋白質相互作用的單個化合物。他補充說,目前正在開發的是將大量關於蛋白質變異的匿名全球基因資料納入其中,以便該軟體可以指定候選藥物最適合哪些患者。Kurji 聲稱,這些功能加在一起最終將能夠將候選藥物從初步識別到人體試驗的典型七年時間框架縮短五年。
默克和拜耳是已宣佈與 Cyclica 建立合作伙伴關係的大型製藥公司之一。與大多數人工智慧製藥合作伙伴關係一樣,這些公司並未過多透露人工智慧生成的候選藥物可能從這些合作中產生的資訊。但 Cyclica 分享了其在識別與已獲得 FDA 批准的用於治療系統性硬皮病(一種皮膚和其他器官的自身免疫性疾病)的藥物相關的關鍵靶蛋白,以及與埃博拉病毒相關的靶蛋白方面的成功案例的一些細節。每種藥物都已獲得 FDA 批准用於治療其他疾病——分別為 HIV 和抑鬱症——這意味著如果研究繼續取得進展,它們都可以快速“重新用於”新的應用。
有時,研究人員會識別出可能在疾病中發揮關鍵作用的靶蛋白,但發現——正如人體內約 90% 的蛋白質一樣——對其結構和特性知之甚少。由於可用的資料很少,大多數機器學習和深度學習程式將無法弄清楚如何“藥物化”該蛋白質——即,提出將與其結合並滿足安全性和有效性其他標準的化合物。少數人工智慧公司正在專注於這些“小資料”問題,其中包括 Exscientia,該公司使用其軟體來尋找可能與靶蛋白協同作用的分子。該公司執行長、蘇格蘭鄧迪大學藥物資訊學教授 Andrew Hopkins 表示,它可以使用關於蛋白質的 10 條資料就產生有用的見解。
Exscientia 的演算法將關於靶蛋白的有限資訊與約 10 億蛋白質相互作用的資料庫進行比較。此步驟縮小了可能有效的化合物列表,並指定了哪些額外資料將有助於進一步縮小範圍。例如,此類資料可能來自檢視組織樣本,以瞭解有關蛋白質在體內行為的更多資訊。然後將生成的新資料輸入到軟體中,軟體再次精簡列表並建議另一輪所需資料。重複此過程,直到軟體準備好生成一份可管理的化合物列表,這些化合物是該靶點的有利候選藥物。
Hopkins 聲稱,Exscientia 的流程可以將發現時間從 4.5 年縮短到僅 1 年,將發現成本降低 80%,並將合成化合物的數量減少到通常生產一種成功的藥物所需數量的五分之一。Exscientia 正在與生物技術巨頭 Celgene 合作,努力尋找針對三個靶點的新潛在藥物。
與此同時,Exscientia 與葛蘭素史克公司的合作已產生了一種有希望的分子,該分子靶向治療慢性阻塞性肺病的新途徑。但與任何解決藥物開發問題的人工智慧公司一樣,Exscientia 進入該領域的時間還不夠長,無法產生足夠多的新候選藥物,使其能夠進入後期試驗——這個過程通常需要五到八年。Hopkins 聲稱,Exscientia 識別出的候選藥物之一最早可能在今年進入人體試驗。“歸根結底,我們將根據我們交付的藥物來評判,”他說。
對新靶點的需求
尋找與新靶點結合的分子並非藥物發現中唯一的主要挑戰。首先還需要識別靶點。為了發現可能在疾病中發揮作用的蛋白質,生物製藥公司 Berg 將人工智慧應用於篩選從人體組織樣本中提取的資訊。Berg 執行長 Niven R. Narain 表示,這種方法旨在解決困擾大多數藥物靶點研究的兩個問題:這些研究往往基於研究人員的理論或猜測,這可能會使結果產生偏差並過度限制候選藥物的範圍,而且它們經常發現與疾病相關的靶點,但最終並未被證實是致病因素,這意味著藥物化它們將無濟於事。
Berg 的方法包括插入可以從患者的組織樣本、器官液體和血液檢查中提取的每一條資料。這些提取的資料包括基因組學、蛋白質組學、代謝組學、脂質組學等等——在尋找靶點時,這是一個異常廣泛的考慮範圍。樣本取自患有和未患有特定疾病的人,以及處於疾病進展不同階段的人。來自樣本的活細胞在實驗室中暴露於各種化合物和條件,例如低氧水平或高葡萄糖水平。這種方法產生的資料涉及從細胞產生能量的能力到其膜的剛度等相應的變化。
然後,所有資料都透過一組深度學習程式執行,這些程式搜尋非疾病狀態和疾病狀態之間的任何差異,目的是最終關注那些其存在似乎對疾病有影響的蛋白質。在某些情況下,這些蛋白質成為靶點的候選者,此時 Berg 的軟體可以開始搜尋藥物化這些靶點的化合物。此外,由於該軟體可以辨別出靶點似乎僅在部分患者中引起疾病健康,因此它可以尋找這些患者的區分特徵,例如某些基因。這為精準醫療方法鋪平了道路,這意味著患者可以在服用藥物之前進行測試,以確定該藥物是否可能對其有效。
Berg 的工作中最令人興奮的藥物——也可能是迄今為止從任何與藥物發現相關的人工智慧工作中湧現出的最令人興奮的藥物——是一種名為 BPM31510 的抗癌藥物。它最近完成了一項針對晚期胰腺癌患者的 2 期試驗,胰腺癌是一種極具侵襲性且難以治療的癌症。1 期試驗通常不會過多地表明藥物的潛力,除了它在給定劑量下是否具有危險的毒性,但 BPM31510 針對其他癌症的 1 期試驗在一定程度上驗證了 Berg 軟體預測大約 20% 可能對其產生反應的患者以及更有可能經歷不良反應的患者的能力。
此外,來自試驗的組織樣本分析使 Berg 的軟體反直覺地預測,該藥物對更具侵襲性的癌症效果最佳,因為它攻擊的是在這些癌症中發揮更大作用的機制。如果該藥物獲得批准,Berg 可能會對服用該藥物的患者進行上市後分析(可能每 100 名患者中抽取一名),“以便我們可以不斷改進其使用方式,”Narain 說。
Berg 正在與製藥巨頭阿斯利康公司合作,尋求帕金森病和其他神經系統疾病的靶點,並與賽諾菲巴斯德公司合作,以尋求改進的流感疫苗。它還在與美國退伍軍人事務部和克利夫蘭診所合作,尋找前列腺癌的靶點。該軟體已經確定了診斷測試的機制,這些機制可以區分前列腺癌和良性前列腺增生,而目前通常很難在不進行手術的情況下做到這一點。
超越炒作
大型製藥公司對將這些人工智慧努力注入藥物發現的興趣可以從至少 20 項主要公司和人工智慧藥物發現技術公司之間報告的合作伙伴關係中看出。據稱,輝瑞、葛蘭素史克和諾華等製藥公司也在內部建立了強大的人工智慧專業知識,其他公司也可能正在這樣做。
儘管這些公司的研究主管對一些早期結果表示了熱情,但他們很快承認,考慮到很少有新的人工智慧輔助候選藥物進入藥物開發的動物測試階段,更不用說人體試驗了,人工智慧對於利潤而言並非萬無一失。羅氏子公司基因泰克公司的高階副總裁 Sara Kenkare-Mitra 表示,人工智慧是否能成功提高藥物發現的效率,目前尚無定論,即使它能做到,“我們還不能說這將是漸進式的改進還是指數級的飛躍。” 如果許多人工智慧努力產生的藥物能夠順利進入人體測試,那麼除非這些藥物一路透過 FDA 批准,否則這個問題仍將無法得到充分解答。
百時美施貴寶公司的 Saha 認為,人工智慧輔助藥物進入市場的速度在一段時間內可能會保持較低水平。然而,如果測試和批准流程得到簡化,以考慮到機器學習和深度學習系統更準確地預測哪些藥物極有可能安全有效,以及哪些患者最適合這些藥物的能力,那麼這種速度可能會大幅提高。“當監管機構看到我們從人工智慧中看到的相同價值時,閘門可能會開啟,”他說。“在某些情況下,一旦我們證明這些藥物可以無毒地擊中其靶點,我們可能會被允許跳過動物模型,直接進行人體測試。”但他承認,這些變化可能還需要很多年才能實現。他補充說,暗示人工智慧取代科學家和傳統研究是錯誤的——雖然人工智慧支援和放大了人類的努力,但它仍然依賴人類來產生新的生物學見解,設定研究方向和優先事項,指導和驗證結果,以及生成所需的資料。
Berg 的 Narain 表示,圍繞基於人工智慧的藥物發現的令人窒息的炒作實際上可能具有破壞性,因為過度承諾可能會導致失望和強烈反對。“現在還處於早期階段,我們需要清醒地認識到,這些是可能有所幫助的工具——它們還不是解決方案,”他說。Cyclica 的 Kurji 指責人工智慧公司做出他所說的誇大營銷宣告,例如將開發一種藥物所需的多年時間和數十億美元減少到幾周和幾十萬美元。“這根本不是真的,”他說。“而且這樣說是既不負責任又具有破壞性的。”
但 Kurji 堅稱,如果炒作會造成傷害,他也知道什麼會給人工智慧藥物發現行業帶來巨大推動:更多高質量的資訊來輸入各種程式。“我們依賴三件事:資料、資料和更多資料,”他說。輝瑞公司藥物科學副總裁 Enoch Huang 也贊同這種觀點,他說擁有正確的演算法並不是最重要的因素。
用大量相關資料來餵養人工智慧軟體的需求實際上正在改變科學,因為研究人員正在開展更多實驗,特別是在考慮到生成與人工智慧相關的資料的情況下。基因泰克的 Kenkare-Mitra 指出,這種情況已經在免疫療法藥物研究中發生。“臨床上並不總是有足夠的資料可用於機器學習,”她說。“但我們通常可以在體外生成這些資料並將它們輸入到系統中。”
這種方法可能會在藥物發現中形成良性迴圈,人工智慧有助於闡明研究人員需要尋找靶點和藥物的領域。此外,由此產生的研究提供了更大、更相關的資料集,使軟體能夠指向更有成效的研究途徑。“我們相信的與其說是人工智慧,”Kenkare-Mitra 說,“不如說是人機合作。”
