在流感爆發前預測疫情有助於官員採取早期行動,以減少相關的死亡人數,全球每年因流感死亡的人數總計達 29 萬至 65 萬。在最近的一項研究中,研究人員表示,他們僅使用社交媒體對話的內容,就準確預測了長達兩週前的疫情爆發。理論上,這些發現可用於將資源導向最需要的地區。
華盛頓州太平洋西北國家實驗室的一個團隊從 Twitter 上關於看似與流感無關的主題(如天氣或咖啡)的對話中收集了語言線索。基於這些資訊,研究人員準確地確定了下一次流感爆發可能發生的時間和地點。
研究人員使用了一種“深度學習”計算機模型,該模型模仿人腦的神經元層和記憶能力。他們的演算法分析了特定時期內 Twitter 語言風格、觀點和交流行為的變化,以及這些變化與後期流感爆發報告之間的關係。
支援科學新聞報道
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道: 訂閱。透過購買訂閱,您將幫助確保未來能夠繼續刊登關於塑造我們當今世界的發現和思想的具有影響力的故事。
“我們使用的深度學習模型的優點在於,它會隨著時間的推移考慮情感和語言線索來預測未來,”計算機科學家斯維特拉娜·沃爾科娃說,她是這項研究的負責人,該研究於去年 12 月發表在《PLOS ONE》上。此前透過網際網路預測流感爆發的努力——包括使用 Twitter 和維基百科記錄的研究以及一個名為 Google Flu Trends 的專案——都專門掃描與流感相關的詞語。相比之下,沃爾科娃的工作檢查了 1.71 億條普通推文,其表現優於其他僅基於關鍵詞搜尋或表明疫情即將爆發的臨床資料的模型。
約翰·霍普金斯大學的計算機科學家馬克·德雷澤說:“在特定的區域性人群中估計流感疫情,突破了我們認為[透過社交媒體]可以做到的極限,併為新的可能性打開了大門。”他沒有參與這項新研究。
美國疾病控制與預防中心的流行病學家馬修·比格斯塔夫警告說,在流感預測方面,我們仍處於“早期階段”。但研究人員越來越多地轉向網際網路來補充官方資料,因為官方資料僅限於實際病例的一小部分,因為許多感染者不尋求醫療護理。此外,這樣一種工具可能有一天有助於識別公共衛生資料完全不可用的地區的流感趨勢。