本文發表於《大眾科學》的前部落格網路,反映了作者的觀點,不一定代表《大眾科學》的觀點
“克林頓在2016年假設性對決中擊敗拜登:民意調查。” 這是MSNBC在7月17日發表的一篇文章的標題,當時距離所討論的選舉還有整整兩年。在細則中,NBC報道稱誤差幅度約為2%至5%,這似乎足夠小,可以信任調查結果。但是,我們應該相信希拉里·克林頓肯定會贏得提名嗎?
270ToWin.com已經有了一個完整的列表,列出了克林頓與所有潛在共和黨候選人的對決,並且顯示克林頓幾乎在每一場對決中都獲勝,但這並不一定意味著她會在三年後成為總統。需要理解的關鍵是,誤差幅度並不總是能描述民意調查中固有的真實誤差,因此,那些標榜誤差幅度很小的民意調查最終可能會完全錯誤。
民意調查的概念基於這樣的假設:民意調查中抽樣人群的意見準確地代表了整個人口意見的分佈,但這永遠不可能完全真實。“誤差幅度”描述了由於相對於人口規模而言,樣本量太小而產生的不確定性。一般來說,調查的人越多,誤差幅度就越小。但這並沒有考慮到另一個關鍵的誤差來源,即“有偏差的抽樣”。民意調查抽樣了很多人,並不意味著它以真正隨機的方式進行抽樣,從而可以將結果外推到更廣泛的人群。不幸的是,許多民意調查都成為許多偏差的受害者,這些偏差嚴重歪曲了他們的結果,儘管他們的誤差幅度很小。
關於支援科學新聞報道
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保關於塑造我們今天世界的發現和想法的具有影響力的故事的未來。
最常見的偏差,稱為便利抽樣,發生在民意調查員使用方便但不完全隨機的策略來選擇調查物件時。一個著名的歷史例子是1936年羅斯福-蘭登總統選舉。《文學文摘》吹噓其民意調查是最準確的,因為他們抽樣了大量的人,誤差幅度小於1%。他們的民意調查都得出結論,蘭登肯定會獲勝,但這並沒有發生。根據韋恩·喬內爾和P·霍爾特·威爾遜在他們的文章謊言、該死的謊言和統計學:揭示民意調查資料背後的真相中所述,事實證明,該雜誌在當時只有富人擁有電話和汽車的情況下,使用汽車登記和電話號碼來尋找民意調查物件。由於這些富人傾向於投票給共和黨,這極大地改變了其民意調查的結果。
2012年巴拉克·奧巴馬和米特·羅姆尼之間的競爭提供了一個更近期的便利抽樣偏差的例子。奧巴馬最終贏得了51.1%的普選票。然而,來自Rasmussen Reports的最終民意調查顯示,羅姆尼在大多數州都更受歡迎。為什麼它預測錯誤的候選人會獲勝?可能有很多不同的原因,但一種假設是便利抽樣偏差。Rasmussen Reports主要透過固定電話尋找其樣本組,而許多人不再使用固定電話。對於那些沒有固定電話的人,Rasmussen使用線上調查。這種方法存在幾個問題。首先,這意味著該公司只能聯絡到擁有固定電話或網際網路接入的人。然而,根據內特·西爾弗,《FiveThirtyEight》的創始人兼編輯,23%的成年人沒有固定電話,4%的人不接聽固定電話,2%的人根本沒有電話。因此,Rasmussen的方法肯定會使民意調查偏向於仍然使用固定電話的更富有和更年長的群體,而這兩個群體都傾向於投票給共和黨。
民意調查誤差的另一個可能來源被稱為志願者偏差,即自願向民意調查提供意見的人並不代表整個人口的分佈。例如,在擁有固定電話的群體中,有些人透過簡單地結束通話電話來回應民意調查電話,透過自動資訊進行民意調查的做法使這種結果在社會上更容易實現,正如Rasmussen所做的那樣。那些花時間聽取自動資訊並做出相應回應的人是那些強烈認為他們的意見必須被聽到的人。根據查爾斯·塞夫在他的著作《數字的欺騙性:你如何被數字愚弄》中所說,對於有在任者的總統選舉,那些對自己的意見非常直言不諱的人通常是那些會投票反對在任者的人,因為他們通常對現狀不滿意,並認為需要改變。那些會投票給在任者的人往往對國家現狀更滿意,因此不覺得自己的意見需要被強烈表達。
Rasmussen使用線上調查進一步加劇了志願者偏差。填寫線上調查需要時間和精力,而不是僅僅在電話中回答某人,這降低了那些未決定或僅略微傾向於一方的人做出回應的可能性。它也更沒有人情味,使人們更容易忽略它。對線上調查的這些保留意見可能會在民意調查中產生大量誤差。
進行民意調查的時間也會影響其誤差幅度。內特·西爾弗在他的著作《訊號與噪聲》中報告說,隨著選舉臨近,民意調查的準確性急劇提高。在選舉前一年進行的民意調查對於領先5個百分點的候選人來說只有59%的準確率,但在選舉前一天卻有95%的準確率。如果你願意,這種時間偏差在2012年總統選舉中得到了清晰的展現,因此,對於現在釋出的對2016年做出預測的民意調查持懷疑態度是有益的。
在今天的期中選舉之後,將進行更多的民意調查,更多的資料將被噴射到國家新聞網路上。為了成功地篩選大量資料,我們必須牢記所有民意調查中固有的由於樣本量和方法論造成的誤差。民意調查資料很少是完美的,並且常常是不確定的或具有誤導性的,因此關注細節是有益的。