為什麼民意調查大多是錯誤的

普林斯頓大學的薩姆·王不得不在 2016 年食言(並吃了一隻蟋蟀)。他談到了疫情和 QAnon 對 2020 年公眾輿論統計的影響

編者注(24 年 11 月 4 日):民意調查更容易出錯,部分原因是回覆率下降和模型不完善。但是,由於健全的投票程式,選舉的實際結果從未如此安全

在 2016 年 11 月大選前的幾周裡,全國各地的民意調查都預測民主黨候選人希拉里·克林頓將輕鬆獲勝。從萬那杜到廷巴克圖,每個人都知道發生了什麼。媒體和民意調查機構因未能預測唐納德·特朗普的勝利而受到指責。民意調查最終在普選票方面是正確的。但他們在關鍵的搖擺州失算了,這些州將選舉人團傾向於特朗普。

這一次,預言家們保證,這些錯誤是如此 2016 年的事情。但隨著 11 月 3 日選票的統計,緊張的觀眾和民意調查員開始體驗到一種似曾相識的感覺。再一次,投給特朗普總統的選票比民意調查預測的要多。儘管選民調查最終只在兩個州——北卡羅來納州和佛羅里達州——指向錯誤的方向,這兩個州都曾暗示喬·拜登會獲勝,但他們錯誤地估計了總體選票中投給特朗普的票數,無論是在紅色州還是藍色州。在民意調查顯示拜登佔優勢的州,投票差額以中位數 2.6 個百分點的幅度轉向特朗普。在共和黨州,特朗普的表現甚至比民意調查顯示的還要好——高達 6.4 個百分點。


支援科學新聞報道

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保有關當今塑造我們世界的發現和想法的具有影響力的故事的未來。


四年前,普林斯頓大學神經科學教授、分析選舉民意調查的部落格 Princeton Election Consortium 的聯合創始人薩姆·王預測克林頓將贏得競選。他非常自信,以至於他打賭,如果特朗普贏得超過 240 張選舉人票,他就吃一隻昆蟲——最終在 CNN 直播中吞下了一隻蟋蟀。王對 2020 年食用節肢動物的任何計劃都諱莫如深,但他的預測再次樂觀:他估計拜登將獲得 342 張選舉人票,並預測民主黨將在參議院獲得 53 個席位,並在眾議院增加 4.6 個百分點。

大眾科學最近與王談論了這次民意調查可能出了什麼問題——以及哪些問題仍然有待解決。

[以下是採訪的編輯稿。]

2020 年大選的民意調查誤差與我們在 2016 年選舉中看到的誤差相比如何?

總的來說,在總統競選中,在勢均力敵的州和藍色州,民意調查誤差約為 2.5 個百分點。這與 2016 年的民意調查誤差大小相似,但這次不太重要,因為競選不像上次那麼接近。

自 2016 年以來,主要的變化不是民意調查,而是政治局勢。我想說,在某種意義上,擔心民意調查是擔心 2016 年的問題。而 2020 年的問題是確保全面和公正的計票,並確保平穩過渡。

儘管如此,還是存在重大誤差。可能是什麼原因導致了這些差異?

紅色州的大民意調查誤差最容易解釋,因為有一個先例:在歷史上總統職位競爭不激烈的州,獲勝候選人通常表現過佳。長期以來,人們都知道,在總統職位競爭不激烈的州,投票率較低,因為我們奇怪的選舉人團機制。在非常紅色的州,疫情可能會加劇“贏家紅利”效應。如果你在一個非常紅色的州,並且你是一名民主黨選民,你知道你的選票不會影響總統競選的結果,你可能會在疫情期間稍微缺乏投票的動力。

這是我認為我們不需要擔心的民意調查誤差之一。但我們可能應該擔心的是在勢均力敵的州中出現的 2.5 個百分點的誤差。這種誤差發生在搖擺州,也發生在民主黨趨勢州。對於密切關注政治的人來說,期望是我們可以走幾條路[在選舉之夜]。一些州在選舉之夜統計和報告選票,而另一些州則需要幾天時間才能報告。之前的民意調查表明,北卡羅來納州和佛羅里達州有可能支援拜登。這將有效地結束總統競選。但競選非常接近,也存在事情會繼續下去的可能性。最終,這就是發生的事情:我們正在觀看賓夕法尼亞州、密歇根州、威斯康星州、亞利桑那州和內華達州進行更多的計票。

總統競選的民意調查與我們今年看到的參議院競選的誤差相比如何?

參議院的誤差更嚴重。有七場參議院競選的民意調查顯示,競選結果在任何一個方向上都在三個百分點之內。粗略地說,這意味著民主黨席位的範圍在 49 到 56 個之間。民意調查的微小失誤會產生非常重大的結果,因為每錯過一個百分點,平均而言,就會導致另一個參議院席位朝一個方向或另一個方向移動。總統競選錯過幾個百分點今年沒什麼大不了的,但在參議院競選中錯過幾個百分點就很重要了。

更準確的民意調查對參議院競選意味著什麼?

民意調查真正重要的原因是幫助人們確定在哪裡投入精力。如果我們對競選的最終結果有更準確的看法,那將表明政治活動家應該在佐治亞州和北卡羅來納州的參議院競選中投入更多精力。

參議院民意調查的偏差大於總統民意調查,這是一個奇怪的錯誤。一種可能的解釋是,選民對參議院競選的關注度低於總統競選,因此沒有意識到自己的偏好。很少有美國人不清楚他們是喜歡特朗普還是拜登。但也許更多的人不會意識到他們自己對比如[共和黨現任議員]湯姆·蒂利斯與[民主黨挑戰者]卡爾·坎寧安[在北卡羅來納州參議院競選中]的心理過程。因為美國政治在過去 25 年裡已經變得非常兩極分化,人們傾向於[最終]為自己的政黨投[直選]票。

考慮到大多數民意調查都高估了拜登的領先優勢,民意調查員是否有可能只是沒有充分地透過電話聯絡到特朗普的支持者?

資料分析師[曾任 Civis Analytics 公司政治資料科學主管]的大衛·肖爾,最近指出,回覆民意調查的人可能不是具有代表性的樣本。他們在某種意義上非常奇怪,因為他們願意接聽電話並與民意調查員保持通話。他給出了證據,表明如果人們是民主黨人,更有可能接聽電話;在疫情條件下,更有可能接聽電話;如果他們在社會信任領域得分很高,則更有可能接聽電話。這很吸引人。其觀點是,民意調查受訪者在社會信任方面的得分高於普通人群,因此,他們不是人口的代表性樣本。這可能會使結果產生偏差。

這也與擁有更多 QAnon 追隨者的州經歷了更不準確的民意調查的想法有關。QAnon 信仰體系肯定與較低的社會信任相關。而這些人可能根本不會接聽電話。如果你相信一個涉及美國主要政黨之一的性虐待的巨大陰謀,那麼你可能會有妄想症。不能排除妄想症患者也不願意回答民意調查的可能性。

在佛羅里達州的邁阿密-戴德縣,我們看到出人意料的西班牙裔選民激增,他們轉而支援特朗普。民意調查可能如何在未能考慮到支援特朗普的該人口群體成員?

民意調查員知道西班牙裔選民是一個難以接觸到的人口群體。此外,西班牙裔也不是一個單一的人口群體。如果你看看一些出口民意調查,似乎西班牙裔對特朗普的好感度高於四年前對克林頓的好感度。西班牙裔的支援這次很可能被民意調查員錯過了。

鑑於總統民意調查在過去兩次選舉中都出現偏差,人們應該對民意調查給予多少關注?

我認為民意調查至關重要,因為它是我們比任何其他方法都更嚴格地衡量公眾情緒的一種方式。民意調查在我們的社會中發揮著關鍵作用。我們不應該做的一件事是將民意調查資料轉化為機率。這掩蓋了民意調查可能存在幾個百分點偏差的事實。最好將報告的資料保留在意見單位[以支援候選人的百分比表示],而不是嘗試將其轉換為機率。

最好不要從民意調查中強行解讀太多含義。如果一場競選看起來在任何一個方向上都在三到四個百分點之內,我們應該簡單地說這是一場勢均力敵的競選,而不要強迫資料說出他們無法表達的內容。我認為民意調查員會吸取這種不準確的教訓,並努力做得更好。但在某種程度上,我們應該停止對民意調查資料期望過高。

© .