統計學家建立大學橄欖球排名的替代模型

加入我們的科學愛好者社群!

本文發表於《大眾科學》的前部落格網路,反映了作者的觀點,不一定代表《大眾科學》的觀點


碗賽冠軍系列賽 (BCS) 大學橄欖球排名正處於動盪之中。連續兩週,排名第一的球隊都被來自德克薩斯州中部的弱隊擊敗。(完全公開:作為貝勒大學的校友,以及農工大學校友的女兒和孫女,我可能有點沾沾自喜。)BCS 排名非常重要:大學橄欖球沒有冠軍賽(尚未),排名決定了哪些球隊可以參加最重要的碗賽,包括排名第一和第二的球隊之間的全國冠軍賽。確定足球碗分割槽 (FBS) 中 120 支大學球隊的排名並非易事,尤其因為球隊只打大約 12 場比賽,這意味著他們不會與 90% 的球隊交手。

目前,BCS 排名由三個部分組成:哈里斯互動民意調查和教練民意調查——兩者都是對各種大學橄欖球專家的調查——以及六個不同計算機排名系統的平均值。這些成分經過加權平均和異常值處理後,形成了我們既熟悉又討厭的 BCS 排名。

排名,尤其是計算機模型,可能很神秘。哪些因素會影響排名,我們可以信任得出的數字嗎?排名建立者需要避免哪些陷阱?去年,亞利桑那州立大學新晉統計學博士安德魯·卡爾問了自己這些問題,並決定使用 BCS 計算機模型規則建立自己的排名系統,以便更好地理解這個過程。然後,他撰寫了一篇關於他自己的大學橄欖球排名模型以及不同選擇對結果影響的論文,該論文在《體育定量分析雜誌》發表(預印本在此)。


關於支援科學新聞報道

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您將幫助確保有關塑造我們當今世界的發現和想法的具有影響力的故事的未來。


卡爾說,BCS 排名系統最大的弱點是它只允許計算機模型考慮球隊的二元勝負記錄,而不是勝負分差,大概是為了減少球隊在對陣實力較弱的對手時刷分的可能性。“從統計學的角度來看,這是一個比使用勝負分差更具挑戰性的概念,”卡爾說。“它有一個非線性組成部分。”(非線性是數學術語,意思是“不可能解決”。)一個問題是,當一支球隊保持不敗時,許多僅使用勝負資料的模型會給他們分配無限的獲勝機率。糟糕。

卡爾的方法使用“廣義線性混合模型”。整個賽季的勝負會為每支球隊建立一個評分。有點令人困惑的是,評分與排名不同。評分的順序決定了排名,但評分包含更多資訊。排名相差一位的球隊可能具有非常接近或非常遙遠的評分。在這種情況下,評分的差異可能在誤差範圍內,但排名不會反映這一點。如果模型是完美的,並且世界沒有意外,那麼評分較高的球隊將始終擊敗評分較低的球隊。“廣義”一詞意味著評分可能不遵循正態分佈,即著名的鐘形曲線,“混合”一詞意味著該模型包含一些隨機效應,因為現實世界會帶來一些意外。不幸的是,該模型最終吐出了一個非常可怕的計算:一個積分,其維度與排名中的球隊數量相同,如果僅限於有資格參加碗賽的球隊,今年是 120 支。(如果您學過多元微積分,還記得 3 維積分有多難嗎?再增加 117 個維度並不會讓事情變得更容易。)卡爾無法確定他的模型與 BCS 使用的計算機模型有何不同,因為大多數模型都是專有的。

卡爾實際上開發了幾個不同的模型,每個模型都改變了評分的分佈、隨機變異的數量和型別、選擇的積分解近似方法,甚至是否只對 FBS 球隊或所有 Division 1 球隊進行排名,包括常春藤聯盟和 Big Sky 聯盟等規模較小的聯盟中的球隊。卡爾發現,總的來說,這些選擇引起的變化與評分的標準誤差相比很小,但當然,即使評分的微小差異也可能改變兩支球隊的排名,從而可能影響誰能參加冠軍賽。

如果計算機模型如此成問題,為什麼還要使用它們呢?卡爾說,今年,佛羅里達州立大學 (FSU) 突顯了計算機排名的實用性。FSU 只有一場失利,但它賽程輕鬆。人工民意調查將 FSU 排在第五和第六位,但計算機排名——包括 BCS 和卡爾的排名——將其排在 15 位左右;與接受調查的人類相比,計算機模型對賽程強度的敏感度更高,並且對勝負記錄的情緒化程度更低。

卡爾說他不是一個賭徒,但他有時會和朋友進行非正式的預測。“我的其他朋友都沒有自己的模型,”他說,但他承認他的模型可能不是最好的模型之一——他是在 BCS 計算機排名系統規則的約束下工作的。如果他真的想大獲全勝,他會使用一個考慮勝負分差的模型。

目前,卡爾的排名與 BCS 的排名相差不遠。BCS 前五名的球隊是(按順序)聖母大學、阿拉巴馬大學、佐治亞大學、佛羅里達大學和俄勒岡大學。卡爾的最佳模型將聖母大學、佛羅里達大學、阿拉巴馬大學、俄勒岡大學和斯坦福大學排在榜首。它們相差不大,但即使是微小的變化也會對最終參加不同碗賽的球隊產生重大影響。在只剩下一支不敗球隊的情況下,誰知道在最後幾週會發生什麼呢?(對不起,聖母大學球迷,但我喜歡這種混亂:加油,南加州大學!)

© .