人工智慧工具預測線上健康錯誤資訊是否會造成現實世界的危害

一種新的基於人工智慧的分析技術揭示了 Reddit 錯誤資訊帖子中特定的語言措辭預示著人們會拒絕新冠疫苗接種

Photo illustration, interface of 'Reddit' is being displayed on a mobile phone screen in front of a red background

Ahmet Serdar Eser/Anadolu via Getty Images

網上錯誤資訊的泛濫不可避免地對公共衛生的關鍵指標產生不利影響,而新冠造成的死亡未接種疫苗的人群中尤為突出。這種因果關係——瀏覽關於羥氯喹、伊維菌素疫苗陰謀論的無休止的帖子可能會誤導人們——似乎再明顯不過了。但從科學角度確定這一點並非易事。

事實證明,錯誤資訊與不利後果之間的明確聯絡很難找到,部分原因是分析公共衛生系統運作的複雜性,部分原因是大多數社交媒體公司通常不允許獨立的外部機構分析其資料。Reddit 是一個例外,該平臺已開始成為一個在公司許可下可以蓬勃發展社交媒體研究的地方。現在,使用 Reddit 帖子的研究可能使科學家更接近找到錯誤資訊的缺失環節。

一種新的分析框架,將社會心理學要素與大型語言模型 (LLM) 的計算能力相結合,可能有助於彌合在線言論與現實世界行為之間的差距。這些結果最近釋出在預印本伺服器 arXiv.org 上,並在本週在夏威夷舉行的計算機協會人機互動系統 CHI 會議上進行了展示。


支援科學新聞報道

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保有關當今塑造我們世界的發現和想法的具有影響力的故事的未來。


弗吉尼亞理工大學的計算機科學家、這項新研究的資深作者 Eugenia Rho 希望確定人們的行為與在 Reddit 等網站上遇到的語言型別之間是否存在聯絡。

Rho 與她的博士生 Xiaohan Ding 及其同事一起,首先追蹤了數千個來自被禁論壇的反對疫苗和新冠預防措施的 Reddit 帖子。接下來,該團隊訓練了一個 LLM 來識別每個帖子的“要旨”——訊息的潛在含義,而不是它所組成的字面意思。“這就是這裡的秘訣,”康奈爾大學的心理學家、該研究的合著者 Valerie Reyna 說。

“模糊-痕跡理論”表明,人們更關注一條資訊的含義,而不是其字面意思。這有助於解釋為什麼人們更有可能記住關於某人被搶劫的軼事,而不是關於犯罪率的枯燥統計資料,或者為什麼賭徒更有可能在將摺疊框定為可能損失金錢而不是可能獲得金錢時下注。“人們更容易被某些型別的資訊所打動,”在 1990 年代幫助開創模糊-痕跡理論的 Reyna 說。

這種對措辭的仔細選擇增強了說服力。“一遍又一遍,研究表明,要旨形式的語言更具粘性,”Rho 說。她的團隊的分析發現,在社交媒體的背景下,對於因果要旨,或者暗示兩個事件之間存在直接聯絡的資訊,情況似乎尤其如此。一個帖子可能會以特定格式將疫苗接種與生病聯絡起來,使用的措辭具有很強的修辭力。例如,一位 Reddit 使用者發帖說:“上[週三]打了輝瑞疫苗,之後感覺生不如死。” Rho 的團隊發現,每次反新冠帖子中的因果要旨變得更強烈時,全國範圍內的新冠住院人數和死亡人數都會激增,即使 Reddit 論壇隨後被禁止也是如此。研究人員從 2020 年 5 月至 2021 年 10 月期間活躍的近 80,000 個子版塊的帖子中提取了資料。

透過使用這個新開發的框架來監控社交媒體活動,科學家們或許能夠預測未來疫情甚至其他重大事件(如選舉)對現實世界健康結果的影響。“原則上,它可以應用於做出決策的任何環境,”Reyna 說。

但這樣的框架可能無法在所有方面都做出同樣好的預測。“當沒有明顯的要旨時,這種方法可能不太成功,”俄亥俄州邁阿密大學的認知心理學家 Christopher Wolfe 說,他沒有參與這項研究。對於研究尋求治療常見健康問題(如乳腺癌)的人的行為,或試圖觀察零星的短暫事件(如極光)的情況,可能是如此。

而且這種方法不一定能區分出存在的特定型別的因果關係。“社交媒體上的要旨似乎可以預測健康決策和結果,但反之亦然,”紐約州立大學理工學院的認知心理學家 Rebecca Weldon 說,她沒有參與這項新研究。相反,它表明社交媒體言論與現實世界行為之間的關係可能更像是一個反饋迴路,兩者相互加強和鞏固。

Wolfe 和 Weldon 都讚揚了作者們創新的分析方法。Wolfe 稱該框架為幫助駕馭線上複雜資訊生態系統的潛在“遊戲規則改變者”。Rho 的團隊希望它可以幫助大型社交媒體公司和公共衛生官員共同制定更有效的管理內容策略。畢竟,能夠識別最能影響人們行為的錯誤資訊型別,是朝著能夠對抗它的第一步。

© .