數字分析:為何特朗普的勝利讓大型民意調查措手不及

不斷變化的技術和反覆無常的人類正在將調查的聚合從藝術推向科學

在數月的預測都指向希拉里·克林頓獲勝之後,美國總統大選在週二晚上出現了一個令人眼花繚亂的意外轉折,唐納德·特朗普將入主橢圓形辦公室。特朗普接連拿下多個搖擺州,讓即使是最優秀的民意調查聚合機構也感到困惑。這些民意調查背後的想法很簡單:多個民意調查的平均結果將比任何單獨的調查都更準確。但是,正如選舉結果所表明的那樣,這種優雅的方法在實踐中失效了。儘管各聚合機構對希拉里·克林頓的獲勝機率存在一些差異(FiveThirtyEight的內特·西爾弗始終給出最保守的估計,而《赫芬頓郵報》普林斯頓選舉聯盟始終給出最高的勝算),但主要的民意調查機構都壓倒性地預測她會獲勝——而他們卻大錯特錯。

造成這種情況的原因有兩個:首先,許多最初的民意調查機構未能產生高質量的民意調查。其次,聚合機構正在使用不完善的統計模型來平均結果。在本輪選舉中,大多數專家認為最大的責任在於第一個因素——民意調查本身。

羅格斯大學的政治科學家克利夫·祖金表示,選舉民意調查正處於危機之中。隨著越來越多的人使用手機而不是固定電話(後者使調查更容易),以及越來越少的人回應調查,民意調查的成本越來越高。因此,民意調查員正在不斷變化的形勢中工作:他們正在微調他們的工作,以聯絡到行動電話,轉向線上調查,並使用統計工具來糾正偏差。但是,這些新方法的準確性在很大程度上未經檢驗,而且在本選舉季中,可供聚合的高質量民意調查的數量也較少。“我們主導的正規化已經崩潰,”祖金說。“聚合機構現在擁有的原始材料不如四年前和八年前那麼好。” 因此,民意調查變得不那麼科學。或者用祖金的話說:“這是一門基於藝術的科學。”


關於支援科學新聞

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您將有助於確保有關當今世界中塑造我們的發現和想法的具有影響力的故事的未來。


但據祖金稱,民意調查中最大的混淆因素是,受訪者誇大了他們投票的可能性。他說,80% 的受訪者表示他們肯定會投票,而之前的選舉顯示投票率約為 60%,這並不罕見。“因此,你需要弄清楚這 80% 的人中,哪些人真正會成為投票的 60% 的人,”祖金說。儘管民意調查員根據受訪者對各種問題的回答構建了“可能投票的選民”量表,但研究並未表明哪些問題最適合此目的。“沒有神奇的公式可以做到這一點,”祖金說。“所以你只能猜測。” 如果他們猜錯了,其影響可能是巨大的——週二晚上發生的事情就是例證。儘管確切的數字需要時間來處理,但似乎越來越多人認為投票率可能影響了今年的民意調查。“我認為,當涉及到唐納德·特朗普時,這裡的解釋可能是,民意調查員做了他們應該科學地做的事情,即根據上次的情況做出我們最好的預測,”密歇根大學傳播學助理教授喬希·帕塞克說。“但實際情況是,這次投票的人與上次投票的人根本不同。……模型低估了受教育程度相對較低(通常投票較少)的白人共和黨人的投票率。”

歸根結底,每個民意調查都包含一個未知的偏差,無論是由於資料質量差還是低估的投票率造成的。因此,聚合機構盡最大努力利用他們手中的牌——透過構建統計模型來更好地分析手中的牌。儘管這些模型的複雜性各不相同,但最簡單的一種是所謂的“民意調查中的民意調查”方法,該方法只是平均所有民意調查的結果,前提是它們各自的偏差至少會部分抵消。但是有些會留下永久的汙漬。10 月,《紐約時報》發現伊利諾伊州一名 19 歲的男子正在將民意調查聚合機構推向特朗普。該男子接受了美國南加州大學多恩西弗分校/《洛杉磯時報》“破曉”民意調查的採訪,其權重比權重最少的受訪者高出 300 倍。因此,大多數聚合機構都將此民意調查從列表中刪除或降低了其權重。事後來看,該民意調查現在被認為是最準確的,並將導致聚合機構重新審視他們用來確定哪些民意調查可靠的指標。

但是,即使聚合機構使用相同的初始民意調查,他們也可能不會預測相同的結果。《紐約時報》在 9 月份發表了一項研究,該研究涉及向四個不同的研究團隊提供相同的原始資料,並要求他們預測選舉結果。在仔細審查資料後,所有四個團隊都得出了不同的結果——不僅是不同的獲勝幅度,而且是不同的獲勝者。“在構建這些模型時有很多選擇,這在很多方面都是一門藝術,”密歇根大學調查方法專案負責人弗雷德里克·康拉德說。“一切都變得數學化,因為它是在模型中實現的。但不知何故,直覺被量化了。”

一旦原始資料被納入模型,聚合機構要考慮的第二大變數就是統計模型本身。大多數聚合機構使用一種混合方法,將某些基本要素(如經濟趨勢或將領導權轉移到另一個政黨的廣泛願望)以及民意調查結果納入其模型中。但是,各聚合機構在預測中應給予這些基本要素多少權重有所不同。帕塞克說,週二的選舉有力地印證了這樣一種觀點,即這些基本要素實際上是主導因素。“雖然你可能認為這與候選人有關——他們說的話,他們相信的東西,”他解釋道,“但最終,這些基本要素往往會佔據主導地位。特朗普可能僅僅因為我們在過去八年裡有一位民主黨人住在白宮而被選為總統。”

因此,在本次選舉中民意調查失敗之後,有沒有哪個大型聚合機構的表現明顯好於其他機構?考慮到它們的所有州級估計都相似,因此很難說。但應該強調的是,FiveThirtyEight 在其對克林頓獲勝的估計中更加謹慎。“這很準確,原因很可笑——不是因為他們真正瞭解發生了什麼,而是因為他們認識到,這種大規模轉變有可能以我們沒有察覺到的方式改變結果,”帕塞克說。例如,FiveThirtyEight 和《赫芬頓郵報》之間的最大區別之一是他們對某些州會一起行動的信任程度。《赫芬頓郵報》不假設一個州的民意調查會強烈影響另一個州的民意調查,《赫芬頓郵報》高階民意調查編輯娜塔莉·傑克遜說。但 FiveThirtyEight 卻這樣做。“因此,這意味著我們整個地圖被系統性錯誤摧毀的可能性要低得多,”傑克遜說。

儘管許多政治科學家對週二的結果感到驚訝,但他們並不認為現在是放棄民意調查的時候了。“我認為,如果說這次選舉暗示了什麼,那就是民意調查並非完全不可靠,”帕塞克說。大多數民意調查在預測各州的情況方面都是相當準確的——除了特朗普在上中西部地區的表現比預期好得多。“總的來說,我認為民意調查提供了一個很好的晴雨表,但似乎有一些系統性錯誤的來源讓每個人都偏離了一點,”帕塞克說。為了更好地確定這些錯誤,將需要進行長時間的自我反省。“可以肯定地說,選舉民意調查行業還有一些工作要做,”傑克遜說。“但我非常樂觀地認為,我們將完成這項工作,併為此而發展成為一個更好、更強大的領域。” 這是一種在整個行業中引起共鳴的想法。“一旦我們看到誰做得好,誰做得不好,我們就會對哪些方法有效,哪些方法無效有更堅實的理解,”祖金說。“但現在我們只是在進行試驗。對我們來說,這是一個狂野的西部。”

© .