本文發表於《大眾科學》的前部落格網路,反映了作者的觀點,不一定反映《大眾科學》的觀點
很可能,您本月聽說了關於一個微小的基本物理粒子的發現,它可能是長期以來人們尋求的希格斯玻色子。科學家們用“五西格瑪”這個詞來描述這項發現的強度。那麼,五西格瑪是什麼意思呢?
簡而言之,五西格瑪對應於一個 p 值,或機率,為 3x10-7,或大約 350 萬分之一。 這不是希格斯玻色子存在或不存在的機率; 相反,它是指如果該粒子不存在,瑞士日內瓦的歐洲核子研究中心 (CERN) 科學家收集的資料至少與他們觀察到的資料一樣極端的機率。“之所以如此令人惱火,是因為人們想聽到明確的陳述,例如‘存在希格斯玻色子的機率是 99.9%’,但真正的陳述中有一個‘如果’。這裡有一個條件。沒有辦法消除這個條件,”凱爾·克蘭默說,他是紐約大學的物理學家,也是 ATLAS 團隊的成員,該團隊是 7 月 4 日在日內瓦宣佈新粒子結果的兩個團隊之一。
科學家使用 p 值來檢驗假設的可能性。在比較現象 A 和現象 B 的實驗中,研究人員構建了兩個假設: “A 和 B 不相關”,這被稱為零假設,以及 “A 和 B 相關”,這被稱為研究假設。
支援科學新聞事業
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞事業 訂閱。 透過購買訂閱,您正在幫助確保未來能夠繼續講述關於塑造我們當今世界的發現和思想的具有影響力的故事。
然後,研究人員假設零假設(因為這是智力上最保守的假設),並計算在 A 和 B 之間沒有關係的情況下,獲得與他們觀察到的資料一樣極端或更極端的資料的機率。這種計算(產生 p 值)可以基於幾種不同的統計檢驗。如果 p 值很低,例如 0.01,這意味著僅有很小的機會(對於 p=0.01 而言為百分之一)在沒有相關性的情況下偶然觀察到資料。通常,在研究領域中會預先設定一個閾值,用於拒絕零假設並聲稱 A 和 B 相關。p=0.05 和 p=0.01 的值在許多科學學科中非常常見。
高能物理學需要更低的 p 值才能宣佈證據或發現。“粒子證據”的閾值對應於 p=0.003,而“發現”的標準是 p=0.0000003。
如此嚴格標準的原因是,幾個三西格瑪事件後來被證明是統計異常,物理學家不願宣佈發現,然後又發現結果只是一個突發事件。一個因素是“他處查詢效應”:當分析非常寬的能量區間時,很可能在某個特定能量水平上您會看到一個統計上不太可能的事件。作為一個具體的例子,連續拋擲 100 次普通硬幣並至少得到 66 次正面的機率略低於百分之一。但是,如果一千人每人連續拋擲相同的硬幣 100 次,則很可能有些人每次至少會得到 66 次正面;這些事件中的任何一個都不應單獨解釋為硬幣被某種方式操縱的證據。
那麼西格瑪從何而來呢?希臘字母西格瑪 (σ) 用於表示標準差。標準差衡量資料點圍繞均值或平均值的分佈,可以被認為是點或值的分佈有多“寬”。具有高標準差的樣本更分散——它具有更大的變異性,而具有低標準差的樣本更緊密地聚集在均值周圍。例如,狗身高的圖表的標準差可能位元定品種的狗身高的圖表更大,即使該品種的平均身高與一般狗的平均身高相同。
對於粒子物理學,使用的西格瑪是來自資料正態分佈的標準差,我們熟悉正態分佈,即鐘形曲線。在完美的鐘形曲線中,68% 的資料在均值的一個標準差範圍內,95% 的資料在兩個標準差範圍內,依此類推。
就上週宣佈的結果而言,這個過程比簡單地從一個實驗中獲取結果並測量資料與預期背景水平的偏差更為複雜;資料來自許多不同的通道,並且每個通道都有不同的預期背景訊號。此外,探測器的測量存在不確定性,必須加以考慮。研究人員使用了一個複雜的公式來組合所有這些變數並計算 p 值。然後,該值被轉換為高於均值的西格瑪數,因為在新發現粒子的能量下觀察到的碰撞次數高於預期的背景。
最後一點導致媒體對與五西格瑪相關的 p 值產生了一些困惑。在正態分佈中,資料對稱分佈在均值的兩側。資料在高尾或低尾中的機率是僅在高尾中的機率的兩倍,因此一些媒體報道稱五西格瑪對應於 p 值為 0.0000006,或 170 萬分之一,而不是正確的 0.0000003,或 350 萬分之一。有關此細微之處的進一步討論,請參閱此理解不確定性部落格文章。
對希格斯發現的興奮導致兩個團隊在所有資料都分析完成之前宣佈了他們的結果。展望未來,在兩個團隊的分析都完成後,各組將合併他們的觀測結果。儘管這兩個實驗都基於相似的物理原理,但以有意義的方式合併他們的資料並非易事。如果您的錢包裡裝滿了美元和歐元(或者如果您訪問歐洲核子研究中心,則裝滿了瑞士法郎),您不能簡單地將鈔票上的數字相加來算出您有多少錢;您必須先進行一些換算。各組將使用克蘭默稱之為“協作統計建模”的方法來合併兩個實驗(ATLAS 和 CMS)的結果。這種方法已經用於對每個團隊實驗中的資料集執行“換算”。完成後,這些分析將傳達對新證據強度的更準確的認識,並確定觀察到的資料是否與物理學家尋求的希格斯玻色子一致。