新發現的不同疾病之間的網路揭示了隱藏的聯絡

龐大的醫療記錄資料庫已開始揭示疾病之間的聯絡,這些聯絡可能為導致我們生病的生物學失誤提供見解

來自 Quanta(在此處查詢原始故事 here)。

斯特凡·圖爾納 是一位物理學家,而不是生物學家。但不久前,奧地利國家醫療保險票據交換所請圖爾納和他在維也納醫科大學的同事檢查一些資料。事實證明,這些資料是匿名醫療索賠記錄——每次診斷、每次治療——幾乎涵蓋了全國人口,人數約為 800 萬人。問題是,如果像最近在希臘發生的那樣,三分之一的資金蒸發掉,是否還能繼續維持同樣的護理標準。但圖爾納認為,這些資料還可以回答其他更深層次的問題。

在最近發表於《新物理學雜誌》的一篇論文中,圖爾納和他的同事彼得·克利梅克 和 安娜·赫米爾 首先研究了 1,055 種疾病在整個人群中的患病率。他們進行了統計分析,以揭示同時患兩種疾病的風險,識別出同時患兩種疾病的人的百分比高於疾病不相關時的預期水平的疾病對——換句話說,患有一種疾病的患者比普通人更有可能患上另一種疾病。他們應用統計校正來降低在非常罕見和非常常見的疾病之間得出虛假聯絡的風險,因為診斷中的任何錯誤都會在這樣的分析中被放大。最後,該團隊將他們的結果顯示為一個網路,其中疾病是節點,當它們傾向於同時發生時,節點相互連線。


支援科學新聞報道

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保有關塑造我們當今世界的發現和想法的有影響力的故事的未來。


這種分析風格揭示了一些意想不到的聯絡。在發表在科學預印本網站 arxiv.org 上的另一篇論文中,圖爾納的團隊證實了糖尿病和帕金森病之間存在爭議的聯絡,以及糖尿病患者出現高血壓的時間的獨特模式。《新物理學雜誌》上的論文產生了他們希望進一步研究的其他聯絡。

最終,圖爾納和越來越多的其他研究人員希望利用這些疾病網路來生成關於疾病如何在分子水平上運作的假設。“這種疾病是由基因引起的嗎?”圖爾納說。“它是由代謝網路中的缺陷引起的嗎?是由於影響某些基因的環境因素嗎?諸如此類的事情。這就是目標。”

這項工作是由這樣一種認識推動的:醫學中定義的疾病聽起來像是整潔、 distinct 的實體,但在現實中卻更加混亂。疾病往往由其症狀定義。但疾病的分子根源可能具有超出我們當前理解的生物學效應。某些疾病往往會跟隨其他疾病或具有高合併症發生率,儘管原因尚不清楚,但可能是因為它們源於相關的生物學缺陷。

東北大學物理學家 Albert-László Barabási 說:“其思想是,細胞水平的聯絡在 population 水平被放大,並以合併症的形式出現。”他發表了幾篇里程碑式論文 在這個領域,包括一篇2009 年發表在 PLOS Computational Biology 上的文章,這篇文章啟發了圖爾納,以及一篇 2011 年發表在 Nature Reviews Genetics 上的該領域綜述。研究人員可以使用疾病網路建議生物學家尋找疾病一和疾病二之間共享的新疾病基因,例如,在似乎存在強烈聯絡的地方。

生物學家通常透過使用全基因組關聯研究來尋找基因聯絡,該研究在統計上將基因標記與疾病聯絡起來。但在哈佛醫學院,另一個研究團隊正試圖透過繪製非常不同型別的網路——細胞中工作的分子網路——來找到相同的聯絡。

生命網路
細胞內部充滿了活力,微小的分子、巨大的蛋白質和 DNA 鏈在彼此周圍沖刷,忙於各自的工作。每個參與者的工作都是其他參與者的集合——例如,蛋白質可能會從其他蛋白質上剪下碎片、運送分子或啟動 DNA 的製造。它從其他參與者那裡獲得線索,這些參與者可以使其工作更快或更慢,或將其傳送到需要的遙遠區域。

如果即使是這個分子社交網路中的一個成員開始表現異常,細胞的功能也會呈現出非常不同的特徵。不久之後,影響會從最初的缺陷向外擴散,在生物體的層面上引起問題——疾病。從某種意義上說,疾病只是這種社會結構潛在動態的一種表達。圖爾納希望他的疾病網路最終能夠幫助揭示其中一些缺陷。

正是在亞微觀層面,約瑟夫·洛斯卡佐,哈佛醫學院教授,也是 Barabási 的長期合作者,正在繪製他自己的網路。他和他的團隊首先從眾多資料庫中收集關於哪些蛋白質相互作用以及如何相互作用的資料。然後,他們使用計算機模型,勾勒出平均細胞內的社交網路,如果基因和蛋白質恰好相互作用,則將它們相互連線。洛斯卡佐的團隊構建了一個包含 13,460 個蛋白質節點和 141,296 個連結的圖表。(洛斯卡佐說,這些相互作用可能僅佔總數的 20% 到 25%,但這只是一個開始。)然後,他們僅隔離統計學上與給定疾病相關的節點。他們將這組節點稱為疾病模組。

 

他們研究的一個疾病模組是肺動脈高壓——肺部高血壓,可能導致心力衰竭。他們研究了全基因組關聯研究表明參與的所有分子通路。然後,他們研究了在動物模型和壓力下的肺動脈高壓患者中哪些通路變得更加活躍。他們的疾病模組顯示,先前與某些形式的疾病相關的兩種蛋白質是同一分子通路的一部分,並且它們協同工作以引起細胞增殖錯誤,這可能與疾病的症狀有關。研究人員在《肺迴圈》雜誌上發表了他們的研究結果

另一個模組著眼於 2 型糖尿病。研究人員透過全基因組關聯研究將糖尿病與基因組上的約 200 個位點聯絡起來。“前 18 個左右非常重要,但最後 182 個左右僅處於邊緣,”洛斯卡佐說。但在疾病模組中,很明顯,這 182 個基因中的一些基因是社交網路中高度連線的樞紐,而全基因組關聯研究本身無法揭示這種狀況。“我們現在已經探索了其中三個[基因],它們突出了以前被認為與糖尿病外圍相關的通路,但從未以任何謹慎的方式證明,”他說。

將洛斯卡佐的分子網路與圖爾納和 Barabási 的疾病網路相結合,將有助於在相關性和機制之間建立橋樑。如果合併症共享重疊的分子網路,研究人員可以使用這些網路來理解其背後的生化機制。這兩種型別的網路在構建方式上截然不同,但它們僅由資料可以揭示否則會被忽視的聯絡這一理念統一起來。但這些網路共同具有開啟疾病研究新大門的潛力。

圖爾納說:“一旦你繪製了一個網路,你就是在紙上繪製假設。”“你在說,‘哇,看,我不知道這兩件事是相關的。它們為什麼會相關?或者僅僅是我們的統計閾值沒有將它剔除?’”在網路分析中,你首先透過檢查它是否重現了人們在你正在研究的任何系統中已經識別出的聯絡來驗證你的分析。圖爾納說,在那之後,“以前不存在的那些,就是新的假設。然後工作才真正開始。”

值得記住的是,這兩種技術都相對較新。洛斯卡佐可以滔滔不絕地說出他的結果可能存在缺陷的方式——關於蛋白質-蛋白質相互作用的資料的龐大不完整性是一個主要問題,但收集資料的方法也是如此,這些方法是目前最好的,但遠非完美。圖爾納和他的學生仍在生物學領域尋找可以檢驗他們假設的合作者。圖爾納 wryly 說,在他們幾年前發表了資料庫的第一批結果後,“我們以為會有數百人坐在我們的辦公室裡”,尋求合作。到目前為止,反應更像是一點點。

芝加哥大學遺傳學教授 Andrey Rzhetsky 說:“這並非沒有爭議。”他擁有數學生物學背景,曾在合併症網路上發表過文章。“有些人對大資料集感覺非常強烈——幾乎到了狂熱地拒絕接受大規模分析結果的地步。”他解釋說,這種論點是,大型資料集中存在未知的偏差。就圖爾納的資料庫之類的資料庫而言,這些偏差源於醫生將資訊輸入醫療記錄的不同方式、種族被考慮的方式等等。Rzhetsky 承認偏差的危險,但他認為,只要研究人員謹慎地解釋資料,偏差就不會消除資料的有用性。“我確實認為這是未來的方向,但這遠不是一個已解決的問題,”他說。他對《新物理學雜誌》上的這篇文章很感興趣。“該模型非常簡單,但方向很好,”他在一封電子郵件中寫道。

洛斯卡佐意識到了他的同事的審視。“當我談論網路醫學時,”他說,“我得到了三種回應。在光譜的一端,通常是年輕人……他們說這是一個很棒的想法,我以前從未考慮過。……在光譜的另一端,我有一些和我同齡或更年長的人說:‘你在說什麼?我是國家科學院的成員,而這一切都基於還原論生物學,我不會改變我的策略。’然後在中間,你有一大批人,他們持健康的懷疑態度,並且希望有一些證據表明這些概念可以為我們提供新的見解。而這正是我們一直在努力的方向。”

量子雜誌 許可轉載,SimonsFoundation.org 的一個編輯獨立部門,其使命是透過報道數學以及物理和生命科學的研究進展和趨勢來增強公眾對科學的理解。

© .