只有一部分 @realDonaldTrump 的推文是唐納德·特朗普本人發的

情感分析發現這位總統候選人機器背後的“幽靈”

本月早些時候,視覺特效藝術家 託德·瓦茲裡 提出一個觀點,認為共和黨總統候選人唐納德·特朗普可能與競選團隊的代筆人共享他的 Twitter 賬戶。這一假設是基於 @realDonaldTrump 在該社交媒體平臺上的語氣和資訊存在著奇怪的差異。根據瓦茲裡的說法,特朗普很可能使用他的三星 Galaxy 安卓智慧手機敲出了最具煽動性的微型部落格資訊,而語氣較為緩和的推文則來自他的工作人員,他們使用的是自己的 iPhone。現在,一項定量分析已經證明他的觀點是正確的。

資料科學家 大衛·羅賓遜 將瓦茲裡的猜測(這既不是新鮮事,也不是非常令人震驚)視為一個絕佳的機會,可以測試他開發的新工具,來分析社交媒體帖子背後的情緒。在挖掘了 @realDonaldTrump 的近 1400 條資訊後,羅賓遜證實,該賬戶的安卓和 iPhone 推文來自不同的人,他們在一天中的不同時間釋出,並以不同的方式使用標籤、連結和轉發。他還發現,特朗普的安卓推文大多比其工作人員的 iPhone 推文更憤怒、更消極,而 iPhone 推文通常是良性的公告和圖片。“我的目標是確定 iPhone 和安卓推文之間的差異,並看看託德·瓦茲裡和其他人的懷疑是否可以得到定量支援,”羅賓遜說。他去年在普林斯頓大學獲得了定量和計算生物學博士學位,現在為 Stack Overflow 工作,這是一個為計算機程式設計師提供問答的網站。

羅賓遜的工具是一種情感分析形式,它將快樂、悲傷或憤怒等情緒與自然語言樣本聯絡起來。“我使用的方法是最簡單的之一:計算與每種情緒相關的單詞數量,”羅賓遜說。他使用了 NRC 詞語-情感關聯詞典 將單詞與情感匹配。該參考指南 將 “瘋狂”、“憤怒” 和 “戰鬥” 等詞與憤怒聯絡起來,而 “獲勝” 和 “愛” 等詞則表示喜悅。羅賓遜使用了他與 同事資料科學家朱莉婭·西爾格 開發的開源文字分析工具,自動計算和歸因特朗普推文中的單詞。


關於支援科學新聞

如果您喜歡這篇文章,請考慮透過 訂閱來支援我們屢獲殊榮的新聞報道。透過購買訂閱,您正在幫助確保有關當今塑造我們世界的發現和想法的具有影響力的故事的未來。


羅賓遜發現,特朗普本人使用的與厭惡、悲傷、恐懼、憤怒和其他負面情緒相關的詞語數量幾乎是其透過 iPhone 傳送的推文的兩倍。此外,iPhone 推文包含圖片或連結的可能性高 38 倍,羅賓遜認為這是因為競選團隊有興趣引起人們對重大事件的關注,並展現出某種程度的外交姿態,例如祝願美國奧運代表隊好運。另一個跡象是特朗普對 Twitter 的轉發功能視而不見,而是傾向於複製和貼上他想傳播的推文,並將這些資訊放在引號中,據羅賓遜說。“值得注意的是,iPhone 和安卓之間最顯著的差異中,很多不是關於情緒,而是關於標籤、照片、連結和轉發的使用,”他說。“將這些結果與情感分析相結合,有助於更全面地瞭解 iPhone/安卓之間的差異。”

區分推文是來自 Twitter 的 iPhone 還是安卓手機應用程式本身並不是什麼秘密。在 Twitter 上執行的每個應用程式都必須在開發人員平臺上註冊,並向該社交媒體網站標識自己。許多 Twitter 應用程式,例如 TweetDeckEchofon(它們幫助人們組織每日的大量推文),也同樣會標識用於釋出特定資訊的平臺。

羅賓遜的分析將引起政治競選以外的更廣泛的興趣,馬薩諸塞理工學院 互動式機器人小組的博士後研究員 布拉德·海耶斯 說。海耶斯最廣為人知的身份是 DeepDrumpf 的建立者,這是一個臭名昭著的 Twitter 機器人,透過模仿這位共和黨總統候選人的用詞和說話方式來生成虛假的唐納德·特朗普推文。社交媒體帖子自動化的現象在名人和其他公眾人物中很常見,他們發現很難滿足填充新聞源的需求。“很自然地,像羅賓遜這樣的分析將越來越受關注,以確定線上存在何時可能由其實際所有者控制,”海耶斯解釋道。

情感分析在營銷人員中也很受歡迎,他們使用這項技術來估計公眾對特定品牌的情感。如果麥當勞想知道顧客對他們的產品與漢堡王或溫蒂相比的感受,他們可能會下載數千條推文並檢查內容中表達的情緒,據羅賓遜說。“這可以幫助他們的營銷策略,例如,[透過]衡量他們客戶最大的抱怨和[識別]他們最具威脅的競爭對手,”他說。

社交媒體審查也被用來試圖預測經濟趨勢和股市表現,儘管結果 尚無定論。“情感分析是一種在特定情況下有用的非常具體的工具,但它不是魔術,”羅賓遜指出。

© .