利用社交媒體從遠處評估健康

透過分析推文和Facebook帖子的語言,科學家們可以越來越多地做出社群範圍的健康預測,甚至進行個體診斷

2010年,在年度谷歌時代精神大會結束後的一天深夜,心理學家馬丁·塞利格曼(當年的特邀演講嘉賓)發現自己與一些科技界的大腕們圍在一起。谷歌剛剛開創了使用搜索引擎查詢來監測流感在美國傳播的先河,谷歌地圖也風靡全球。這些工具的潛在應用似乎是無限的,因此,積極心理學的奠基人塞利格曼和谷歌聯合創始人拉里·佩奇等人開始探索各種可能性。

如果能開發出類似“谷歌流感趨勢”這樣的工具來描繪美國的心理健康狀況呢?具體來說,他們想知道,計算機演算法是否可以透過追蹤人們在社交媒體上使用的語言,來準確預測幸福感和福祉在時間和空間上的變化。

在幾個月內,塞利格曼與我和賓夕法尼亞大學的其他幾位同事共同啟動了世界福祉專案(WWBP),最初是與谷歌的慈善機構Google.org合作。從那時起,我們由心理學家、計算機科學家、統計學家和應用程式開發人員組成的跨學科團隊迅速壯大。現在,它包括13名專職科學家,與世界各地的政府和組織合作開展45個子專案。


支援科學新聞報道

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道: 訂閱。透過購買訂閱,您將有助於確保有關塑造我們當今世界的發現和思想的具有影響力的故事能夠繼續存在。


2015年1月,我和我的同事發表了一項重要的概念驗證結果。我們評估了來自美國約1300個縣的超過1億條推文,這是來自Twitter的公開資料樣本。我們發現,特定地點負面推文(尤其是表達憤怒或敵意的推文)的比例可靠地預測了當地因心臟病導致的死亡率。許多其他研究結果也陸續出現,揭示了推文或Facebook帖子中的語言與年齡、性別、性格和收入水平,以及精神疾病和身體疾病等特徵之間的關聯。

這些結果清楚地表明,社交媒體資料是一種豐富的資源,心理學家、社會學家、流行病學家和其他人可以挖掘這些資源,以進行有價值的社群範圍的健康預測,甚至進行個體診斷。機會可能非常巨大,但這個快速發展的領域也有陰暗面。對人們在社交媒體上如何使用語言的分析完全基於統計模式。但它們可能非常具有啟發性,以至於情報人員、政治候選人和商業人士——從營銷人員到保險精算師——與科學家一樣對它們的應用感興趣。事實上,很少有人意識到演算法可以從他們在Facebook和Twitter上的日常活動中收集到多少資訊。

詞語可以揭示什麼

在WWBP團隊開始測試推文以發現健康趨勢之前,谷歌已經邁出了一個有趣的初步步驟。2008年,時任該公司首席健康戰略師的醫生羅尼·澤格爾和他的同事推出了“谷歌流感趨勢”專案。該專案發現了谷歌上與流感症狀和治療相關的搜尋詞,並記錄了這些搜尋的地理位置。透過這種方式,他們可以即時繪製感染的傳播情況。值得注意的是,他們對流感季節的追蹤與美國疾病控制與預防中心收集的統計資料相符——只是谷歌首先獲得了資訊,因為他們不需要等待醫生和醫院報告每次疫情。“谷歌流感趨勢”專案於去年終止,但該專案證明,搜尋查詢為監測特定疾病的傳播提供了一種可行的方法,並啟動了現在被稱為數字流行病學領域的先河。更新的嘗試正在探索將搜尋查詢作為監測手段,不僅監測流感,還監測登革熱、瘧疾和性傳播疾病。

理解整個人群的心理狀態(正如我們的專案努力做的那樣)可能比追蹤疾病要微妙一些:沒有人會像在感到不適時搜尋治療方法那樣谷歌搜尋“我很快樂”。因此,我們不得不採取一種不那麼直接的途徑,分析人們在社交媒體上寫的內容,而不是他們的搜尋詞。數十年的研究發現,人們在日常對話中選擇的詞語可以揭示他們潛在心理的很多資訊。而且,一個人的精神狀態和身體健康之間存在無數聯絡。例如,壓力、消極、焦慮和抑鬱會損害我們的免疫系統和心血管系統。同樣,積極情緒和樂觀情緒似乎具有保護作用,降低了包括動脈粥樣硬化性心臟病在內的多種疾病的風險,並延長了預期壽命。

從20世紀90年代開始,社會心理學家詹姆斯·潘尼貝克(現為德克薩斯大學奧斯汀分校攝政百年教授)和他的同事們對詞語與福祉之間的聯絡進行了一系列有趣的發現。他們正在研究為什麼事後寫下創傷經歷的人(一種稱為表達性寫作的技巧)比那些將令人不安的經歷保密的人更不容易生病。為了評估他們的受試者寫的內容,他們使用計算機程式快速統計這些文章中包含的詞語和概念。

令他們驚訝的是,他們發現寫作的實際內容——無論它是否包含積極或消極的語言和想法——所揭示的參與者的精神健康狀況不如功能性詞類所揭示的多。例如,他們發現,處於抑鬱症痛苦中的人並不一定寫悲傷的事情,但他們確實可靠地使用了更多第一人稱單數代詞:我、我的、我的。抑鬱症患者傾向於沉思,並且經常非常專注於自己的痛苦。他們發現,當參與者開始在寫作中使用更多因果詞(因為、因此、但是)和複雜的語言時,創傷症狀通常會減輕。這些模式似乎表明,患者開始理解創傷並將其整合到一個連貫的敘述中。

隨著Facebook、Twitter和類似應用程式在過去十年中的興起,可用於分析的語言資料量急劇增加,為心理學家們打開了一扇瞭解社交媒體使用者心理健康狀況的廣闊新視窗。(一般來說,我們處理匿名資料,並請求Facebook使用者的許可。)當然,人們在網上展示的是他們自己的一個版本,誇大好的行為、特質和事件——研究人員將這種偏差稱為社會期望偏差。但這種偏差通常沒有你想象的那麼扭曲。人們與現實生活中的朋友成為Facebook好友這一事實通常有助於他們在網上保持相當誠實。現實生活中的熟人知道他們的生活並非全是野餐和聚會。此外,由於這些偏差往往會平等地影響每個人,演算法仍然可以區分出人與人之間的關鍵差異。為了支援這一觀點,當我們將我們的方法的預測結果與以傳統方式(電話調查、醫院報告等,這些方式更具代表性地抽樣人口)收集的資料進行比較時,我們常常驚訝於兩者之間有多麼接近。

推文中的大海撈針

社交媒體動態中的語言——充滿了俚語和表情符號——呈現出一組具有挑戰性的解析資料。我們今天之所以能夠從中提取有意義的模式,要歸功於過去30年中自然語言處理技術的突破。隨著計算能力的指數級增長,使用統計模式識別演算法(也稱為機器學習)處理語言變得越來越可行。這些工具近年來發展迅速,並實現了諸如蘋果的Siri和谷歌的分析程式等應用,這些程式會在你的電子郵件收件箱旁邊投放那些令人毛骨悚然的恰當廣告。

在這些進步之前,心理學中的語言分析是基於更簡單的基於詞典的方法,這些方法將情緒狀態與預先確定的詞語列表聯絡起來。例如,如果文字中出現了“快樂”這個詞,它就被認為是積極情緒的標誌。這種方法有時會產生令人困惑的結果,因為語言本身就是模稜兩可的。當早期在該領域的工作將心理學家制作的“積極情緒”詞典應用於社交媒體動態時,它錯誤地表明元旦的幸福感出現了巨大飆升——僅僅是因為人們互相祝願“新年快樂”。

現代機器學習方法避免了這些錯誤。它們從不可知論開始——也就是說,它們對哪些詞語表示什麼情緒或特質不做任何假設——然後它們聚類、計數、評分和隔離詞語,以從頭開始“學習”心理關聯。一個缺點是,這些方法僅適用於至少有5000到10000名使用者的資料集。事實上,條目越多,結果越準確,因為額外的輸入使我們能夠從日常帖子的所有噪音中隔離出甚至微弱的訊號。對我們來說幸運的是,大多數社交媒體網站現在都有數億使用者。

2013年,現任石溪大學的H·安德魯·施瓦茨、塞利格曼和我,以及我們的同事,發表了一項研究,其中我們將機器學習方法應用於從75000名志願者的Facebook訊息中收集的7億個單詞、短語和主題,這些志願者也參加了性格測試。到目前為止,這是將語言和性格聯絡起來的最大規模的研究,數量級更大。一旦演算法掌握瞭如此多Facebook使用者的狀態更新,並瞭解了這些使用者在性格測試中的得分,它們就可以將詞語與性格特質相關聯。

利用研究結果,我們建立了詞雲,以顯示最能區分外向型和內向型以及神經質和情緒穩定性的詞語。我們發現,有些詞語很少使用,但當使用時,它們對心理特質具有高度預測性。例如,“抑鬱”這個詞的使用是神經質的一個強有力的(如果很少見)標誌。

許多關聯都是有道理的,但有些是令人驚訝的。你可能已經預測到外向型的人更常使用“聚會”這個詞,而內向型的人更常使用“電腦”這個詞,但你是否會猜到,神經質得分高的人更頻繁地使用“顯然”這個詞?或者,情緒穩定的人更頻繁地寫關於體育運動的內容?或者,內向型的人對日本媒體(如動漫)和表情符號表現出更大的興趣?在我們同事格雷戈裡·帕克領導的一項後續研究中,我們將演算法應用於另一組Facebook帖子,實際上僅使用使用者的動態來預測他們的性格。值得注意的是,演算法的表現與朋友們填寫關於受試者的性格調查問卷一樣好,甚至更好。在某種意義上,演算法最終比他們的朋友更瞭解這些人!我們將這一結果視為我們已經掌握了期望偏差的一個好跡象。

然後,我和我的同事在Twitter上使用了相同的方法,來估計美國約1300個縣的平均“心理概況”,而無需敲任何人的門。根據美國疾病控制與預防中心關於死亡原因的資料(基於實際死亡證明),推文表達更多負面情緒、憤怒和敵意(充滿了諸如“仇恨”和詛咒等詞語)的縣,心臟病死亡人數也最多。樂觀的縣心臟病相關死亡率較低。當我們進一步深入研究資料時,我們意識到我們的方法在預測動脈粥樣硬化死亡方面特別有效,甚至比其他形式的心臟病更有效。動脈粥樣硬化性心臟病是美國的主要死亡原因,毫不奇怪,它是被認為與心理原因最相關的心臟病型別。

奇怪的是,發推文的人並不是死亡的人。我們的方法沒有說明任何人的動脈粥樣硬化個體風險。相反,推文的總體基調——通常來自太年輕而不會有心臟問題的人——似乎捕捉到了整個社群心理的快照。這些推文有可能檢測到社會學家經常提到的社群凝聚力這種難以捉摸的品質,粗略地定義為社群成員合作和互相幫助的意願。研究表明,社群凝聚力越強,其成員往往越能享受良好的身心健康。目前,我們正在擴充套件我們的分析,以尋找預測所有主要死亡原因(包括癌症和中風)的詞語和語言模式。但我們預計,在這方面,更積極的——並且大概更具凝聚力的——社群會表現得更好。

建立健康儀表板

我們基於Twitter對社群範圍心臟病死亡人數的預測,比任何使用政府統計資料對已知風險因素(包括肥胖、糖尿病、吸菸和高血壓)進行的預測都更準確。事實上,結果非常可靠,以至於即使在我們控制了強大的經典預測因素(如教育和貧困)之後,我們的語言變數仍然可以預測心臟病發病率。

隨著越來越多的人使用社交媒體,我們的預測可能會變得更好。十年前,只有特定人群是Facebook使用者——主要是青少年和年輕人。然而,截至2015年10月,皮尤研究中心報告稱,65%的美國成年人經常使用社交媒體網站——自2005年以來增加了10倍。90%的年輕人使用社交媒體,而65歲以上的人群的使用率自2010年以來增加了兩倍多。Twitter使用者的中位年齡為32歲——僅比美國人口的中位年齡小6歲。

與美國疾病控制與預防中心的行為風險因素監測系統或蓋洛普民意調查(考慮到小得多的樣本,成本也高得多)相比,基於Twitter或Facebook的健康評估可以提供更快、更便宜的社群範圍福祉儀表板指標。我和我的同事現在已經與英國的大學、南澳大利亞州政府和墨西哥當局進行了諮詢,他們渴望透過Twitter追蹤健康趨勢,可能會開始在下一次全國人口普查中詢問人們的社交媒體賬號。在許多方面,在一個越來越少有人可以透過座機電話聯絡到的世界中,這是一個自然的步驟。

對社交媒體上語言的分析也可能應用於幫助臨床醫生治療個體患者。我們專案的萊爾·昂加爾和其他人最近與雷納·默錢特和其他賓夕法尼亞醫學院的同事合作,在賓夕法尼亞大學醫院的急診室放置了iPad。我們要求急診室患者自願登入Facebook,並允許分析他們的狀態更新。然後,使用我們的機器學習方法,我們將所有語言模式與他們的醫療記錄相關聯。檢視資料後,我們發現了一系列潛在的各種疾病的語言標記——包括抑鬱症。未來,醫生或許能夠分析社交媒體帖子中疾病的語言警報訊號,並對患者進行適當的隨訪。

事實上,分析我們生活敘事的手機應用程式似乎完全有可能幫助醫生在不同情況下提供更好的護理。想象一下,一位心理治療師每天都會收到來自其抑鬱症患者的自動情緒讀數,然後可以給他們發簡訊傳送關鍵提醒、見解或緊急建議。或者一位醫生監測社交媒體動態,尋找心臟病發作患者抑鬱症的跡象,抑鬱症是心臟病發作患者再次發生危機的重大風險因素。2013年,微軟研究院的一個團隊使用推文預測了376位新媽媽的產後抑鬱症。他們的模型在僅分析產前帖子時準確率達到71%,而在同時包含出生後最初幾周的推文時準確率達到約80%。

這些用途遠比保險提供商或放貸人偷偷使用社交媒體分析來拒絕服務或提高費率要好得多。在我們的研究中,我們始終獲得許可來分析參與者的線上動態,並遵循嚴格的隱私準則。但很少有Facebook使用者意識到,允許訪問他們的狀態——甚至僅僅是他們的“點贊”——就可以為公司提供相當精細的性格特徵。社會有一種沿著其最強大技術發展的共同進化方式——我們需要科學界、政策界和產業界的許多人共同努力,才能把這件事做好。不過,我們越是意識到社交媒體分析在改善我們的健康和福祉方面的潛力,我們就越能加入到以有意識、合乎道德甚至拯救生命的方式塑造我們未來的努力中。

© .