2016年9月15日

希拉里的競選活動（幾乎可以肯定）正在使用大資料

證據表明，她的競選活動正在使用奧巴馬曾成功使用的高度針對性技術——但特朗普可能沒有利用這種技術

作者：埃裡克·西格爾

本文發表於《大眾科學》的前部落格網路，反映了作者的觀點，不一定反映《大眾科學》的觀點

分析學將在今年贏得選票。正如2012年一樣，科學在美國總統競選中對大規模選民說服起著重要作用。這是一場數字遊戲：預測分析針對競選活動，透過更優地驅動其活動來加強競選活動的志願者隊伍。

我說的是哪位總統候選人？我們有充分理由相信，希拉里·克林頓的競選活動正在利用預測分析——就像奧巴馬在2012年所做的那樣。唐納德·特朗普的競選活動在這方面似乎落後。

“希拉里為美國”正在以一種非常特殊的方式利用資料科學。這項工作預測每位選民對競選活動的接觸的反應，以便驅動數百萬個關於哪個選民應該被敲門或打電話的決策。這是一個創新的、資料驅動的過程，它改變了政治競選的遊戲規則。

關於支援科學新聞

如果您喜歡這篇文章，請考慮透過以下方式支援我們屢獲殊榮的新聞事業訂閱。透過購買訂閱，您正在幫助確保有關塑造我們今天世界的發現和想法的具有影響力的故事的未來。

內特·西爾弗預測未來——但不會改變它

競選活動的數字運算是一項秘密行動——但另一種形式的定量預測是公開的：透過民意調查聚合進行競選預測。在這裡，重量級冠軍是內特·西爾弗，美國最著名的統計學家，他在2012年正確預測了每個州的選舉結果。點選此處檢視他當前的2016年預測。

但是，選舉民意調查並不構成預測技術——它並不試圖計算洞察人類行為的見解。相反，民意調查顯然是選民明確告訴你他們要做什麼的行為。這是一次小型選舉預演。聚合民意調查是一項技巧，正如西爾弗已經熟練掌握的那樣，但即使他也承認這不是什麼千里眼奇蹟。“這真的沒有那麼複雜，”他在2012年選舉前一天告訴深夜脫口秀主持人斯蒂芬·科爾伯特。“有很多事情比看民意調查和取平均值要複雜得多……對吧？”

相反，真正的力量在於影響未來，而不是僅僅猜測未來。內特·西爾弗公開競爭以贏得選舉預測，而奧巴馬的分析團隊則透過預測分析秘密競爭以贏得選舉本身——正如“希拉里為美國”現在正在做的那樣。這是一種超越預測結果以實際對其產生影響的定量預測形式。

2012年證明的價值對於2016年來說太好了，不容錯過。“奧巴馬為美國”表明，他們的分析比傳統的競選目標說服了更多的選民。該方法還改進了競選活動的電視廣告購買，使電視廣告購買的效率提高了18%——他們可以用相同的投資水平說服多18%的選民，考慮到他們4億美元的電視預算，這是一個有意義的效果。

證據：“希拉里為美國”正在使用分析學進行選民說服

具體細節是嚴守的秘密，但證據清楚地表明，“希拉里為美國”正在部署預測分析——更具體地說，是其一種稱為說服模型（又名提升模型）的更高階形式——正如“奧巴馬為美國”所做的那樣。以下是支援這一推測的資料

1) 吸引力。 丹尼爾·波特是為“奧巴馬為美國”執行說服模型的三位實操人員之一，他後來與人共同創立了分析公司 BlueLabs（見下面的問答），他堅持這種技術方法。 “仍然很清楚，說服模型對於政治競選活動來說非常寶貴。事實上，在上次積累的經驗之後，可以肯定的是，2016年的競選活動將比2012年更有效地完成這項工作，”他告訴我。他說，至少在民主黨方面，這項工作也將有更好的資料。“民主黨全國委員會正在進一步建設其關於搖擺州選民的資料基礎設施。”

2) 招聘。 早在 2015 年 7 月，“希拉里為美國”競選團隊就釋出訊息稱，他們的“分析團隊正在尋找資料狂人”。在競選團隊網站上顯示的 11 個競選職位類別之一中，分析學包括五種型別的空缺職位。更具體地說，分析學職位招聘人員從事說服模型工作：“幫助競選團隊確定哪些選民是說服目標。” 競選團隊的分析主管是埃蘭·克里格爾，他是 BlueLabs 的另一位聯合創始人，他透過從 BlueLabs 挖人來擴大了競選團隊的資料團隊。

3) 合同。 “希拉里為美國”已聘請 BlueLabs 提供分析服務——至少價值 5 萬美元。Civis Analytics 是另一家分析公司，該公司僱用了至少 27 名來自奧巴馬 2012 年競選團隊的“資料神童”（埃裡克·施密特是唯一的投資者）在過去的兩個週期中，已從民主黨競選活動中獲得超過 350 萬美元的付款。

在他於紐約預測分析世界大會（10 月 23 日至 27 日）上發表主題演講“總統競選中的說服模型及其在商業中的應用”之前，我有機會向丹·波特提出了一些關於他為奧巴馬工作以及 2016 年選舉中可能發生的事情的問題。

問：當您為“奧巴馬為美國”2012 年應用提升模型時，您發現的最令人驚訝的發現或見解是什麼？

我們在 2012 年發現，自我報告的獨立人士和無黨派人士尤其不可能被說服，而許多與政黨有關聯的選民實際上是可以被說服的。然而，在我們自 2013 年以來在 BlueLabs 進行的提升模型工作中，情況並非總是如此。我們吸取的教訓是，不斷的實驗和提升模型是一項值得努力的工作，因為可以被說服的人的型別可能因特定的競選活動、資訊、模式和時間而差異很大。

問：將提升模型應用於商業營銷活動與應用於政治競選活動之間最大的區別是什麼？

在政治方面，我們依靠調查作為選民候選人偏好的代表。這是我們擁有的最好的代表，但它仍然依賴於自我報告的意圖，並且需要創新的抽樣設計，以確保調查是公正的，並且能夠覆蓋具有代表性的人口樣本。然而，在商業方面，在許多情況下，我們可以根據實際購買資料構建和驗證我們的提升模型。這使得問題更加直接。

問：有什麼公開證據表明特朗普的競選活動正在或沒有使用預測分析，甚至特別是提升模型？

我們真的不知道特朗普在做什麼或沒做什麼。我們對民主黨方面的競選活動和組織在分析能力方面處於什麼位置充滿信心，但重要的是我們繼續創新，並且我們不能擔心右翼團體在做什麼/沒做什麼。

事實上，特朗普競選團隊“正在摒棄巴拉克·奧巴馬贏得白宮競選的核心精密資料運作。” 有人猜測，這不僅可能會損害他在選舉中的機會，還會使共和黨全國委員會（通常認為在資料和分析方面已經落後於民主黨全國委員會）無法為未來的競選活動收集有價值的資料。

先進且具有分析性，但並非神秘莫測，用於選民說服的預測模型為政治開啟了全新的篇章。