早在世界衛生組織首次警告在中國武漢出現一種神秘的新型呼吸道疾病近一週前,波士頓的一個全球疾病監測系統 HealthMap 的偵探團隊就從一篇線上新聞報道中捕捉到了關於疫情爆發的數字線索。同一天,12月30日,另一個數字疾病檢測組織 ProMED 注意到中國微博網站“微博”上關於不明原因肺炎的線上討論。正如研究人員後來報道的那樣,社交媒體平臺微信上新流行的關鍵詞包括“非典”、“呼吸急促”和“腹瀉”。
這些警報揭示了一種巨大但有風險的資源的希望:來自世界各地人們的推文大小的提示,他們線上報告自己的健康狀況並宣洩恐懼。一些研究人員呼籲公共衛生官員更多地利用這個虛擬的寶藏資料,尤其是在當前新型冠狀病毒迅速傳播的情況下。
“我們正處於一個前所未有的機遇的風口浪尖,可以使用數字資料來追蹤、預測和預防人群中的全球疾病負擔,”北卡羅來納大學吉林斯全球公共衛生學院的流行病學家 Allison Aiello 和兩位研究生在 2020 年《公共衛生年度評論》中寫道。
關於支援科學新聞報道
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保未來能夠繼續講述關於塑造我們當今世界的發現和想法的有影響力的故事。
“社交媒體部落格、聊天室和當地新聞報道中存在大量資料,這些資料每天都為我們提供有關疾病爆發的線索,”波士頓兒童醫院首席創新官兼哈佛醫學院的 John Brownstein 最近告訴 CNN Headline News。Brownstein 稱這些資料為“數字面包屑”,它們是新興的數字流行病學領域的重要原始材料。他於 2006 年共同創立的 HealthMap 是該領域的幾個領先機構之一。
HealthMap 的第一個重大成功案例發生在 2009 年 H1N1(豬流感)大流行期間,當時它使用了包括西班牙語線上新聞報道在內的來源,以幫助早期發現墨西哥韋拉克魯斯的一種不明呼吸道疾病。五年後,它利用世衛組織的 Twitter 訂閱源和其他來源來追蹤埃博拉病毒的傳播,該病毒最終在西非導致超過 11,000 人死亡。
世界衛生組織現在經常使用 HealthMap、ProMED 和類似的系統來監測傳染病爆發,併為臨床醫生、官員和公眾提供資訊。然而,與傳統方法相比,大資料疾病檢測仍處於起步階段,特別是社交媒體成分,尚未在預測傳染病可能在何處以及如何爆發方面做出任何重大貢獻。
到目前為止,至少 HealthMap 仍然沒有過多依賴社交媒體;相反,它主要追蹤來自線上新聞來源和政府的報告,同時包括一些來自公共衛生專業人員的社交媒體帖子。此外,HealthMap 呼籲志願者每週向其眾包疾病追蹤平臺 Flu Near You 提交資料。3 月下旬,它推出了一個新網站 Covid Near You,專門關注 Covid-19 症狀和檢測。
儘管如此,Brownstein 和其他專家認為,數字流行病學的兩個關鍵優勢——速度和數量——可能會越來越多地幫助衛生官員快速且廉價地發現疫情爆發。與此同時,來自社交媒體的大量數字資料也帶來了足夠的準確性和隱私挑戰,使其成為“雙刃劍”,倫敦大學學院電子健康研究員 Patty Kostkova 如此說道。這是一個現在很常見的故事:技術進步正在超越我們保證其質量和安全的能力。
最直接的挑戰是確保準確。“實際上,從社交媒體獲得有用的前瞻性資料非常困難,”東北大學計算機科學家 Clark Freifeld 說,他與 Brownstein 共同創立了 HealthMap。他說,最大的挑戰之一是,一旦某種疾病成為新聞,大多數後續媒體查詢和帖子都是對該新聞的反應,而不是更多新聞即將到來的指標。
例如,2012 年,谷歌流感趨勢根據谷歌搜尋中與流感相關的術語使用量的增加,估計冬季流感病例將大幅增加。但實際的峰值大約只有一半,這可能是因為使用者的搜尋反映了流感爆發的新聞,而不是實際的疾病。
虛假訊號是另一個嚴重的問題。研究人員注意到 2007 年穀歌對“霍亂”一詞的搜尋量激增。但原因並非疾病爆發;相反,事實證明是奧普拉·溫弗瑞為她的讀書俱樂部選擇了小說《霍亂時期的愛情》。Aiello 說,雖然這個特殊案例並沒有誤導任何公共衛生官員,但它是一個生動的反應性和不相關的“噪音”的例子。
HealthMap 試圖透過使用人工智慧來過濾掉重複和不相關的資訊來解決這個問題。“我們有一個包含數百萬篇文章和與疾病爆發相關的內容的資料庫,”Freifeld 說。“我們會手動標記例如 10 萬個實際爆發的例子,並將它們與不相關的東西進行對比,例如第七局的本壘打‘爆發’。這就是系統學習什麼有用和什麼沒用的方式。”
數字面包屑可能誤導專家的一個主要原因是它們可能會遺漏很大一部分人口。大約 22% 的美國成年人使用 Twitter,但這不是一個隨機樣本。美國 Twitter 使用者主要比其他美國人更富有、更年輕、受過更好的教育並且更有可能成為民主黨人。更重要的是,大多數 Twitter 使用者並沒有發太多推文:所有美國成年使用者約 80% 的推文來自最多產的 10%。考慮到老年人——至少根據最初的假設——更有可能患上重病,Twitter 年輕化的使用者群體尤其成問題。因此,透過推文監測健康狀況可能會忽略我們中最脆弱的人群。
更廣泛地說,社交媒體因傳播虛假資訊而臭名昭著,在傳染病的情況下,這可能會造成致命的後果。公共衛生研究人員表示,在社交媒體噪音中尋找訊號時,這始終是一種危險。公共衛生依賴於公眾對公共衛生官員的信任,但如果政府釋出錯誤資訊,這種信任可能會迅速瓦解。
除了準確性問題外,數字流行病學還可能增加對網際網路使用者隱私的威脅。與歐洲不同,美國缺乏保護社交媒體隱私的全面法律。谷歌和 Facebook 等平臺經常將彙總的使用者資訊授權給廣告商,廣告商可以根據搜尋內容和“點贊”來定向投放廣告。Freifeld 說,將此類資料用於健康監測可能會增加隱私濫用的風險,尤其是在公共衛生問題與保密性衝突時。
隱私倡導者已經對白宮和美國疾病控制與預防中心最近為擴大他們訪問美國人手機資料以追蹤他們在疫情期間的位置的努力發出警報。聯邦衛生官員希望納入匿名的彙總資料,以追蹤病毒的傳播並檢查對新的“社交距離”規則的遵守情況。
線上公共衛生資料的日益增長的儲存庫在本月剛剛向公眾開放了一些。3 月 17 日,Facebook 最近收購的社交媒體監測網站 CrowdTangle 宣佈,它已推出一項新功能,允許使用者(包括新聞媒體組織、公共衛生官員和研究人員)跨 Facebook、Instagram 和 Reddit 等網站追蹤社交趨勢。該公司同時推出了一個公開可用的流媒體中心,有限的即時顯示了關於新型冠狀病毒引起的 Covid-19 感染的官方資訊和社交媒體帖子。社交媒體帖子僅來自公共帳戶,而非私人帳戶。
自願報告系統可以避免一些(儘管不是全部)常規數字流行病學的偏見。Flu Near You 於 2011 年推出,使用匿名的眾包模型為公共衛生官員和研究人員收集資料。
一個有些類似的專案是 FoodBorne Chicago,這是一個基於 Twitter 的監測系統,用於監測食物傳播疾病的投訴。它位於芝加哥公共衛生部,使用機器學習演算法追蹤帶有關鍵詞“食物中毒”的推文。噹噹地居民輸入這些詞時,該網站會回覆一個連結,其中包含一個表格,用於提供詳細資訊,收集可能永遠不會被報告的資料。
在過去的七年中,美國疾控中心透過管理一項名為 FluSight 的年度競賽,涉足疾病的數字檢測領域,學術界和工業界的研究人員在競賽中嘗試預測流感季節的時間和強度。美國疾控中心要求參賽者在其預測中使用某種數字資料。
與此同時,研究人員越來越對納入來自更直接的健康和疾病測量資料的前景感到興奮。智慧可穿戴健康追蹤監測器提供關於心率、步數和睡眠質量的持續資料流。
3 月 25 日,斯克裡普斯研究所轉化科學研究所的流行病學家 Jennifer Radin 是最近一項關於 Fitbit 在疾病檢測中可能發揮“至關重要”作用的研究的主要作者,她呼籲使用任何型別的智慧手錶或活動追蹤器的美國成年志願者透過下載 MyDataHelps 移動應用程式與研究人員分享他們的健康資料。Radin 告訴 Knowable,研究人員希望使用這些資料來識別可能表明疾病的靜息心率變化。雖然她承認心率加快可能僅僅是由觀看新聞引起的,但她說感覺不舒服的志願者也可能在該應用程式上列出其他症狀。
在過去的八年中,一家名為 Kinsa 的舊金山初創公司一直在系統地收集此類即時健康資料,最近已售出並贈送了超過 100 萬個聯網溫度計。俄勒岡州立大學科學家 Benjamin Dalziel 正在與 Kinsa 資助的研究合作,他說該系統可以準確地追蹤流感,比美國疾控中心的預測提前兩週,並且可能還可以追蹤 Covid-19。3 月 18 日,它開始在其“健康天氣地圖” www.healthweather.us 上釋出來自其選擇加入系統關於“非典型發燒”叢集的新資料。
Dalziel 和 Kinsa 公司領導人確信溫度計可以在這次全球緊急事件中發揮作用。Dalziel 說,使用這些和其他型別的系統來即時監測症狀“是未來,無論這聽起來多麼宏大……發燒是急性呼吸道感染的關鍵指標。它衡量的是與疾病直接相關的東西。雖然我認為從 Twitter 中提取資訊已經完成了出色的工作,但溫度計讀數顯然比推文更具優勢。”*
其他專家也對 Kinsa 的進展感到興奮。“鑑於缺乏 Covid 特異性檢測試劑盒,發燒監測是一個好主意,”HealthMap 的 Freifeld 說。
冠狀病毒緊急情況顯然正在加速人們對數字流行病學的興趣。然而,Freifeld 和其他專家一致認為,到目前為止,該領域的希望仍然更多地是作為傳統監測的輔助手段,而不是替代品。
正如北卡羅來納州的 Aiello 承認的那樣,至少目前是這樣:“我們需要用傳統的實地資料來驗證它。”
本文最初發表在 Knowable Magazine 上,Knowable Magazine 是 Annual Reviews 的一項獨立新聞事業。註冊新聞通訊。
在此處閱讀更多關於冠狀病毒爆發的資訊。
*編者注(2020 年 3 月 31 日):我們在 Knowable 的合作伙伴已更新此段落,以澄清 Benjamin Dalziel 的觀點。
