本文發表於《大眾科學》的前部落格網路,反映了作者的觀點,不一定代表《大眾科學》的觀點
我已經有一段時間沒有在這裡寫作了,因為最近我一直忙於一種非常不同的寫作型別——完成我的博士論文。促使我回到部落格世界的原因之一是我對最近第四頻道節目《藥物直播:迷魂藥試驗》的反應。
現在,我不會討論在電視上服用非法藥物的倫理問題,因為這個問題已經被充分討論過了。相反,我想提請大家注意一個在某些人看來可能是一個很小的點,但我認為它代表了整個媒體科學報道中一個更大的問題。這篇文章比我通常的文章更廣泛,但它與動物行為有關,動物行為作為媒體呈現的熱門話題,經常以這種方式被誤傳。
首先,看看節目中的這張圖表
關於支援科學新聞
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保有關塑造我們今天世界的發現和想法的有影響力的故事的未來。
這似乎表明,人們在服用迷魂藥(MDMA)後比沒有服用時(對照組)投入了更多的錢(在計算機模擬的臉上),並且這種影響從一天增加到八天……但真的是這樣嗎?這張圖表並沒有告訴我們這一點。
我想說的是,為了展示這些柱狀圖之間是否真的存在差異,我們需要看到所謂的“誤差線”。誤差線是一種直觀地顯示您所做的測量值的變化程度的方法。例如,如果我站在牛津街攔住 1000 個人,問他們是否可以數數他們的手指,如果人們讓我這樣做,而不是在退縮之前奇怪地看著我,我可能會發現平均手指數量是 10 個(或者略低於 10 個,因為有人失去手指的可能性可能比多一個手指的可能性更大)。然而,我抽樣的大多數人很可能都有 10 個手指。由於手指數量的這種微小變化,如果我在圖表上繪製它,誤差線就會很小。
另一方面(真的不是雙關語),如果我在街上攔住另外 1000 個人,數數他們錢包裡有多少沒用的東西,我可能會發現平均值也是 10 個,但這次變化會大得多:很多整潔、有條理(或者我喜歡稱之為反社會)的人會擁有零個沒用的東西,而其他人可能會有幾十張廢紙、可以追溯到 20 世紀 80 年代的收據以及他們甚至不知道存在商店的獎勵卡。這次的誤差線會很大。
透過在圖表上放置誤差線,我們可以看到我們正在檢視的資料中有多少變化,更重要的是,可以直觀地評估不同組的平均值實際上彼此不同的可能性有多大。
例如,這張圖表(我剛剛編造的資料)顯示,男性比女性喝更多的啤酒(平均每週 20 杯而不是 15 杯;紫色柱狀圖)。然而,英國人並沒有比美國人吃更多的餡餅(綠色柱狀圖)。即使平均數字相同(女性喝 15 杯啤酒,美國吃 15 個餡餅,男性喝 20 杯啤酒,英國吃 20 個餡餅),誤差線告訴我們資料彼此之間非常不同。在吃餡餅的數量方面,資料變化很大,英國和美國的一些人吃的餡餅很少,而另一些人吃了很多,最有可能的是位於曼徹斯特的人。由於每個組(英國和美國)內的資料變化很大,我們無法確定平均值在英國比在美國更多的事實是否是真實的發現,還是僅僅是由於偶然性造成的。
回到“藥物直播:迷魂藥試驗”,由於他們的任何圖表上都沒有誤差線,我們無法確定我們看到的任何差異是否真的存在。簡而言之,這些圖表毫無意義。
在藥物科學網站上,大衛·納特、瓦爾·柯倫和羅賓·卡哈特-哈里斯寫道,他們最初在圖表上包括了誤差線(和 p 值),但第四頻道為了清晰起見刪除了它們。這有點諷刺,因為這樣做,他們無意中使結果更難解釋。顯然,第四頻道認為,向普通觀眾解釋會“很困難”。我認為第四頻道不應該對他們的觀眾抱有偏見。人們喜歡被挑戰,並發現起初可能不清楚的事情;這就是人們繼續觀看懸疑謀殺案的原因。即使該節目沒有足夠的時間來解釋誤差線是什麼,我也不認為人們會發現圖表在有誤差線的情況下更難解釋,甚至可能會導致人們去谷歌搜尋並自己找出它們的用途。
我認為,讓人們更容易瞭解科學過程越好,而做到這一點的最好方法是透過像這樣的電視節目。作為一項既做了原創工作,又涉及許多人感興趣的話題的研究,它似乎非常適合電視。我在這裡的抱怨不是專門針對第四頻道,而是針對更普遍的科學呈現方式。人們掌握越多關於實驗如何設計、進行然後解釋(使用統計作為工具)的工具,科學家和所有人(包括立法者)之間的溝通就會越好。
*********************************************************************************
如果您渴望瞭解誤差線之外的更多統計資訊,我前幾天偶然發現了這個很棒的部落格。