綠意盎然的外野。馬皮棒球擊打牛皮手套的砰然聲。搜尋匆忙丟棄的注射器。是的,棒球又回來了。
在我第一次發現這項運動的神聖日子裡,統計資料的神聖三位一體是 AVG(打擊率)、HR(本壘打)和 RBI(打點)。今天我們有了 OBP、OPS、UZR 和 WAR——以及更多字母湯。
為了更靈活地運用這些數字,一月份我前往曼哈頓東 11 街一家名為 Bergino Baseball Clubhouse 的小型收藏品商店,聽取史密斯學院經濟學教授安德魯·津巴利斯特的演講,他與前紐約大都會隊數字分析師、現任史密斯訪問數學教授本傑明·鮑默合著了《資料棒球革命:評估棒球分析學的增長》。(沒錯——他們分析分析結果。誰來監督監督者?就是這些人。)
支援科學新聞報道
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您將幫助確保有關塑造我們當今世界的發現和想法的具有影響力的故事的未來。
首先,什麼是資料棒球學?傳奇統計學家比爾·詹姆斯創造了這個術語,在“美國棒球研究協會”的略微修改的縮寫“SABR”中添加了“metrics”(度量)。津巴利斯特解釋說,“資料棒球學”指的是使用統計分析來理解和評估球員表現、球隊策略和管理層策略。” 可惜的是,它並沒有提到如果總經理的球隊表現不佳,他到底要自責到什麼程度。
資料棒球學在公眾中得到廣泛推廣,得益於 2003 年出版的書籍,以及後來的 2011 年電影《點球成金》,這是一個關於出人意料地表現出色的 2002 年奧克蘭運動家隊的故事。該球隊的關鍵是深入的資料分析,找到了價格低廉且被低估的球員。而其重要的統計資料是 OBP,“上壘率”(大致為安打加上保送除以上場打擊次數),因為正如古老的棒球格言所說,“保送和安打一樣好。”
實際上,當安打是本壘打時,保送顯然不如安打好,即使本壘打在計算打擊率時與安打的計數方式相同。這就是為什麼現在衡量打擊的最流行方法之一是 OPS,“上壘加長打率”,它對力量進行加權。因此,盧·格里克在 1928 年世界大賽中對陣聖路易斯紅雀隊時,OPS 高達驚人的 2.433,而他的打擊率僅為可憐的 .545。
津巴利斯特對《點球成金》的一些說法提出了異議。例如,對上壘率的關注並不能解釋 A 隊的團隊 OBP 如何從 2000 年的 .360 下降到 2001 年的 .345,再到其奇蹟年(annus mirabilis)的 .339。但他最 salient 的評論是針對我們這些引用阿爾伯特·愛因斯坦的頻率至少與西奧·愛潑斯坦一樣高的人。
津巴利斯特和鮑默在《資料棒球革命》中寫道,“除了白手起家的主題,[《點球成金》這本書] 還呼應了現代文化中另一個老生常談的說法——量化就是科學的認知。” 如果你所做的只是計數,你可以統計一百萬個從蘋果樹上掉下來的蘋果,而不會提出萬有引力理論。
在他的演講中,津巴利斯特還批評了兩個較新的統計資料。 UZR,即“終極區域評分”,聲稱可以衡量臭名昭著的難以量化的防守。“當德里克·基特一年處於 UZR 排名的後 10%,而第二年他處於前 10% 時,你不得不質疑,UZR 衡量的是什麼?” 衡量基特約會的女模特的面部對稱程度的統計資料無疑會在一年又一年之間具有更高的相關性。
最後,還有“高於替代球員勝場數”,或 WAR,它旨在計算一名球員相對於標準替補球員為球隊總勝場數增加的勝場數。 顯而易見且必要的後續問題是,WAR:它有什麼用? 也許並非完全沒有用,但可能比表面上看起來的要少。
“這些現在是專有指標,”津巴利斯特說。“生成這些指標的人正在向球隊出售他們的指標……他們用來輸入其演算法的數字……以及他們如何權衡所有這些不同的數字——他們沒有告訴我們…… 只要它是一個黑匣子,它就沒有任何意義。”
津巴利斯特指出了大都會隊三壘手大衛·賴特,他從三個不同的組織獲得了幾乎相同的 WAR 值。 但是我們所知道的總統計資料的內部方面卻大相徑庭。 因此,對相似值的趨同讓人想起四個去獵鴨的統計學家。 四個人都錯過了鴨子,但由於他們的射擊平均值在鴨子所在的位置,他們宣佈:“我們打中它了!” 是的,就像紅雀隊的投手群擊敗了盧·格里克一樣。