ArXiv.org 達到里程碑和反思

空前的成功和資金不足導致預印本伺服器面臨越來越多的困境

Piles of paper documents in the office

它最初於 1989 年只是少數弦理論家的電子郵件列表,如今已發展成為超過兩百萬篇論文的合集,並且是物理學家、天文學家、計算機科學家、數學家和其他研究人員的中心樞紐。1 月 3 日,預印本伺服器 arXiv.org 憑藉一篇題為“仿射迭代和包裹效應:各種方法”的數值分析論文,跨越了這一里程碑。 (相比之下,據信亞歷山大圖書館的藏書不超過數十萬份手稿。)

賓夕法尼亞州立大學天體物理學教授、arXiv 科學主任斯坦因·西古德森說:“我們是作者快速自由地交流研究成果的一種方式。” 與傳統的科學期刊不同,arXiv(發音為“archive”,因為“X”代表希臘字母 chi)允許科學家在研究經過同行評審之前分享研究成果。

在向傳統期刊投稿時,作者通常需要等待半年或更長時間才能發表;論文通常在一天內出現在 arXiv 上。作者經常將手稿提交給 arXiv,然後再在同行評審期刊上發表,但越來越多的論文僅在 arXiv 上釋出。除了傳統的手稿外,arXiv 還包含 白皮書歷史概述,甚至 滑稽的愚人節論文


關於支援科學新聞業

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您將有助於確保有關塑造我們當今世界的發現和想法的具有影響力的故事的未來。


“它就像我們領域的支柱,”位於日內瓦附近的全球領先的粒子物理研究組織歐洲核子研究中心 (CERN) 的科學資訊服務主管亞歷克斯·科爾斯說。“它不僅是物理學家和計算機科學家的工具,而且對整體學術交流過程產生了影響。” 例如,生命科學領域受 arXiv 啟發的預印本伺服器,例如 bioRxivmedRxiv,已被證明在加速冠狀病毒大流行期間的生物醫學研究方面非常寶貴。

增長是爆炸性的。2008 年,即上線 17 年後,arXiv 的論文數量達到了 50 萬篇。到 2014 年底,這個總數翻了一番,達到一百萬。七年後,arXiv 的圖書館再次翻了一番,但仍在努力應對其角色:它更接近於精選的學術期刊,還是更像一個不加選擇地收集論文的線上倉庫?

在這種困惑中,一些研究人員對 arXiv 的稽核政策表示擔憂,他們說這些政策缺乏透明度,並導致論文被不公平地拒絕或錯誤分類。與此同時,arXiv 正在努力提高其稽核員的多樣性,這些稽核員主要是在美國機構工作的男性。

在物理學家中,有一種常見的說法:“如果它不在 arXiv 上,它就不存在。” 換句話說,對於廣泛的研究學科而言,arXiv 已變得不可或缺,成為科學過程本身的一部分。對於使用它的研究人員來說,arXiv 是他們日常工作流程的一部分:他們可能會在早晨喝咖啡時瀏覽新版本,在中午之前提交論文,並在晚上下載閱讀材料。這種突出的作用證明了 arXiv 的成功,但也表明了儲存庫的問題不僅僅是它自身的問題,也是科學界的問題。

圖片來源:Amanda Montañez;來源:arXiv.org

災難性的成功

在 arXiv 出現之前,物理學家有一個郵寄預印本的傳統。尚未透過同行評審的手稿的紙質副本在全球範圍內的實驗室和大學圖書館之間傳送,供渴望獲取最新科學新聞的讀者閱讀。隨著時間的推移,預印本的數量變得巨大,郵件變成了電子郵件。然後,在 1991 年,現在在康奈爾大學的保羅·金斯帕格將他的物理學家同事喬安妮·科恩的電子郵件列表自動化為一個任何人都可以提交和訪問的儲存庫。效果立竿見影。

科爾斯說:“在幾年之內,粒子物理學中的幾乎每篇文章都首先提交給了 arXiv。” 憑藉其令人印象深刻的快速釋出時間和隨後在物理學、數學和計算機科學的其他領域廣泛採用,arXiv 迅速成為檢查新結果的主要場所,而不是傳統的期刊或會議。

西古德森說:“望遠鏡在星期五看到了一些東西。到星期一,就有了關於它的論文。到星期二,就有了反駁星期一發表的論文的論文。” “這很有趣。這很令人興奮。”

現在在韓國科學技術院的研究員金蘭宇領導了一項研究,發現高被引 arXiv 論文的作者越來越 不太可能費心在傳統期刊上發表。“如果他們從 arXiv 獲得了足夠的興趣,他們可能會選擇不經歷期刊出版過程中的這些麻煩,”金說。她的研究發現,傳統期刊仍然對引用具有重要的影響,但它們更多地充當研究的管理者而不是分發者。

儘管取得了成功,但 arXiv 一直在努力應對穩定性和資源問題。該伺服器經歷了動盪,將其位置遷至康奈爾大學內。目前,只有少數工作人員獲得資金來幫助志願者稽核員處理每天多達 1,200 份的提交。“我們是一輛老式經典汽車,鏽跡終於顯現出來,活塞正在磨損,”西古德森說。“我們人員不足,資金不足——而且這種情況已經持續多年。”

同樣,arXiv 作為一個機構的增長並沒有跟上依賴它的科學界的增長。“在很長一段時間裡,它基本上是由少數人運營的,”科爾斯說。即使在今天,大約 150 個類別也只有大約 200 名志願者稽核員,他們每個人每天可能要處理多達 30 篇論文——這一因素導致了延誤和其他問題。

一切適度

當作者提交論文時,它會進入佇列,由稽核員進行例行評估。如果稽核員沒有將論文標記為存在問題,通常會在第二天釋出。但是,稽核員經常介入,將釋出延遲數天或數週,重新分類論文,甚至直接拒絕提交。

印度蘇拉特卡爾卡納塔克邦國家技術學院的物理學家迪帕克·瓦伊德說:“他們正在採取的行動似乎與預印本伺服器的角色背道而馳。” 瓦伊德指出,他所說的是稽核不一致和缺乏透明度。

延遲可能看起來微不足道,但對於爭先恐後地宣佈某些發現或大膽新假設的科學家來說,即使是幾天也可能至關重要。透過將論文重新分類到 arXiv 的“一般”類別——一個通常充斥著質量可疑的研究的包羅永珍的類別——稽核員可以有效地隔離他們認為不符合更精細類別標準的提交。最後,稽核員可以簡單地拒絕論文。

西古德森說:“我們必須劃清界限,”他指出,arXiv 有時會收到可能是偽科學的提交,例如作者聲稱“證明了愛因斯坦是錯誤的”或構建了“萬物理論”的提交。為了防止大量胡說八道湧入,arXiv 規定提交作者必須經過“驗證”。最初,驗證是基於學術隸屬關係,但今天它可以替代地依賴於“認可”系統:任何人都可以提交,只要有經過驗證的使用者,他在同一“學科領域”內撰寫了一定數量的論文,為他們擔保。“我們有點磕磕絆絆地走下去,因為這總比沒有好,”西古德森說。

瓦伊德同意,認可或其他驗證系統對於清除偽科學是必要的。但他說,由於預印本伺服器不是期刊,arXiv 及其稽核員應該簡單地放寬標準,減少對拒絕的干預。

西古德森提出了一個反駁。“如果信噪比變得太差,那麼它就會變得毫無用處。那麼你還不如閱讀 YouTube 評論,”他說。在 arXiv 上,大約 6% 的提交會被暫緩釋出,大約 2% 會被拒絕。頂級期刊,例如自然科學,接受的論文不到 10%。 (arXiv 在質量控制方面的努力也引發了競爭性預印本伺服器的建立,例如 viXra.org,它們以最少的監督歡迎提交。毫不奇怪,主流學者認為此類儲存庫的效用極小。)

雖然稽核不是同行評審,但 arXiv 的稽核員與編輯具有相同的權力來拒絕論文。“他們執行了我所稱的‘同行評審的單次檢視近似’——不假裝對快速週轉進行全面審查,並應用低得多的門檻,”金斯帕格說。“他們的偏見始終朝著‘接受’的方向,因為我們期望科學能夠自我糾正。”

對於一些充滿希望的作者來說,arXiv 據稱的低接受門檻使任何拒絕都更難以接受。2017 年,瓦伊德的一篇文章因其引言“使用了非常戲劇化且具有誤導性的語氣”而被拒絕。當他要求澄清以幫助重寫引言時,arXiv 代表回應說“稽核員不是審稿人,不提供其決定的詳細資訊。”

由於稽核員沒有時間對每次提交進行全面的同行評審,因此 arXiv 的政策是不詳細說明其拒絕的原因。“我們不想陷入爭論,”西古德森說。可以對拒絕或錯誤分類提出申訴,但該過程很繁瑣——基本上重複了同行評審的麻煩,只是為了在預印本伺服器上釋出。

2021 年 8 月,arXiv 稽核員拒絕了備受推崇的中國科學家陸朝陽和潘建偉的論文,他們每個人都在量子研究中貢獻了許多“第一”。陸朝陽和潘建偉沒有提出申訴,而是明確選擇在 viXra 和其他伺服器上 釋出預印本,儘管陸朝陽在 公開表達了對 arXiv 拒絕的困惑和沮喪之後才這樣做。義大利博洛尼亞大學的理論物理學家羅伯託·卡薩迪奧獨立審查了這篇論文,無法理解它為何被拒絕。卡薩迪奧說:“它調查的主題完全在 arXiv 的廣義相對論和量子宇宙學類別範圍內。“結果是對還是錯是 arXiv 讀者群體可以——也應該——有機會獨立評估的事情。”

尋求代表性

arXiv 某些困境的一個來源可能是其稽核員陣容的不平衡。在儲存庫的大約 200 名稽核員中,只有 13% 是女性,並且如前所述,大多數稽核員是在美國機構工作的男性。許多稽核員已經在他們的領域工作了幾十年,從數學、物理學和其他物理科學領域的多樣性甚至低於現在的時代開始。

西古德森承認:“如果 [arXiv 的稽核員] 反映了本質上相當於終身研究小組的人口結構,那將是很好的。” 但招募新團隊成員很困難,因為稽核是一項基本上吃力不討好的任務,幾乎沒有職業回報,而且有很多缺點。特別是女性稽核員,經常成為辱罵性電子郵件的目標。

除了性別和國籍方面明顯的失衡之外,瓦伊德還指出了意識形態代表性方面更隱蔽的問題。在統一量子場論和引力方面,弦理論仍然比迴圈量子引力等競爭方法更受歡迎。稽核員,就像期刊編輯一樣,有權決定發表哪些型別的理論。雖然沒有收集到可靠的資料來證實這種懷疑,但瓦伊德認為,迴圈量子引力的支持者比弦理論家更常被拒絕。

沿著所有這些方向實現稽核員多樣化是否會解決批評者的抱怨尚不清楚。畢竟,沒有“中國物理學”或“美國數學”,國際科學界的成員有很多共同之處。但是稽核員多樣性問題和過度熱心或不適當的拒絕問題可能相關。

六年前,日內瓦大學的量子物理學家尼古拉斯·吉辛聲稱,在他們的論文於 2014 年被拒絕後,他的 學生受到了 arXiv 的審查。 (該論文的修改版本 隨後通過了同行評審,並於 2015 年發表在《物理快報 A》上。) 對於吉辛來說,該事件提出了一個問題:arXiv 屬於誰——是運營該網站的工作人員和志願者,還是為它提供研究成果的全球科學家社群?

金斯帕格說,arXiv 的最初意圖是“屬於”更廣泛的物理學界,但他指出,雖然該伺服器最初是為物理學家設計的,但如今計算機科學論文幾乎佔了提交的大多數。

儘管 arXiv 在法律上以康奈爾大學為中心,並得到美國西蒙斯基金會和一個國際學術機構聯盟的財政支援,但科爾斯說,“我們的研究人員感覺 arXiv 屬於科學界。”

如果它真的屬於依賴它並用兩百萬篇論文填充它的更廣泛的科學界,那麼這對 arXiv 的未來意味著什麼?

對於瓦伊德來說,答案很明確:“一切照舊”的做法註定要失敗。“沒有問責制——零,根本沒有,”他說。他認為 arXiv 需要對其標準更加透明,並解釋拒絕的原因。西古德森表示,在 arXiv 實施更全面的同行評審的提議極不可能成功。但他表示,他計劃在未來幾年增加稽核員的數量,至少達到 300 人,以便每個類別至少有兩名稽核員。

金斯帕格也承認,arXiv 的獨特地位賦予了社群責任。“儘管如此,在許多領域,世界的科研成果都透過單一門戶傳遞,這仍然是一個原則問題,”他說。“[ArXiv 的] 行動和任何無意的偏見都應不斷受到審查。”

如果目前的步伐保持下去,arXiv 將在本十年結束前再次將其圖書館翻一番。未來兩百萬篇論文將包含哪些發現是無法知道的,但 arXiv 在科學領域的明星作用似乎不太可能消退。

在最近的圖書館翻新期間,一項調查詢問了歐洲核子研究中心的工作人員想要什麼:新傢俱?更好的咖啡?“他們說的是‘在那裡放一個大螢幕,並編寫一個指令碼,自動顯示 arXiv 每日新提交的內容’,”科爾斯說。“它可能會成為歐洲核子研究中心圖書館的中心。”

© .