廣受歡迎的預印本伺服器 arXiv.org,物理學家、數學家和計算機科學家經常在同行評審前上傳手稿以公開分享他們的研究成果,現在擁有 超過 100 萬篇 研究論文。
該儲存庫於 1991 年 8 月作為“電子公告板”推出,就在全球資訊網興起之前。它花了 17 年時間積累了 50 萬份手稿,但僅用了 6 年多時間就使其擁有量翻了一番。
研究人員現在每月向 arXiv 提交約 8,000 篇文章,平均每天超過 250 篇。該網站的管理員在經過簡短的質量控制檢查後,以批次形式提供原始的、未經同行評審的手稿,例如由 130 名志願者版主進行粗略的適當性瀏覽,以及自動過濾以檢查與現有論文的文字重疊情況。
關於支援科學新聞
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道: 訂閱。透過購買訂閱,您正在幫助確保未來關於塑造我們當今世界的發現和想法的有影響力的故事。
在管理員放完假並於聖誕節前夕(12 月 24 日)下班後更新伺服器上的手稿後,該網站於 12 月 29 日達到了 100 萬篇論文。
從 arXiv 主頁上目前顯示的論文執行計數來看,具有里程碑意義的第 100 萬篇論文是 '使用聯合懲罰的協方差和逆協方差矩陣的良好條件且稀疏的估計',該論文由密歇根州立大學東蘭辛的 Ashwini Maurya 於 12 月 26 日格林威治標準時間 7:34:19 提交。但實際上,該網站的第 100 萬篇文章無法如此精確地確定,arXiv 創始人、紐約伊薩卡康奈爾大學的物理學家保羅·金斯帕格說。由於提交的索引方式以及偶爾出現的重複或垃圾提交(現在可以透過篩選軟體發現,但在該網站的早期更容易遺漏),該計數實際上是一個略微模糊的估計。
一場革命的開始
arXiv 海量的免費手稿現在與科學期刊中發表同行評審手稿的較慢系統並行執行。但噹噹時在新墨西哥州洛斯阿拉莫斯國家實驗室工作的金斯帕格建立了一個電子服務來分享“為數百位在高能物理子領域工作的同事和朋友”的預印本文章時,這一切還很遙遠,正如他在 2011 年為 arXiv 二十週年紀念日撰寫的《自然》文章中所述。自成立以來,該伺服器已擴大其覆蓋範圍,涵蓋物理學中的許多其他領域,以及數學、計算機科學、統計學和金融與生物學的定量方面。
arXiv 伺服器的受歡迎程度在不同學科之間有所不同。一些物理學家最初不願意在正式的同行評審出版物之前分享他們的結果,但當他們意識到快速公開他們的工作的好處時,他們就接受了這個想法。例如,2008 年發現的一類鐵基超導體使許多凝聚態實驗學家湧入該網站,“他們被建立優先權並讓他們的結果出現在理論家面前的需求所征服”,金斯帕格在他的 2011 年的文章中寫道。
如今,許多重要的發現首先發布在該網站上。當隱居的俄羅斯數學家格里戈裡·佩雷爾曼證明龐加萊猜想(一個關於三維空間性質的陳述,它抵抗了近一個世紀的證明)時,他只在 arXiv.org 上釋出了他的論文,而沒有在其他任何地方釋出。(佩雷爾曼後來 拒絕了 因這項工作而獲得的菲爾茲獎)。去年,該網站 在生物學領域激發了一個模仿者,由紐約冷泉港實驗室出版社推出的 bioRχiv.org。
arXiv 正在以前所未有的速度擴張。12 月 19 日,它 宣佈 將其論文標識號加長一位數字,以應對預計每月超過 10,000 次提交的峰值。它現在每月收到超過 1000 萬次下載請求。
這一切都不是免費的,但仍然相對便宜。預計的年度成本 在 2014 年,人員和伺服器的支出為 885,987 美元,每增加一篇論文不到 10 美元。其中大部分資金由成員機構(在康奈爾大學圖書館於 2010 年發出呼籲後)和位於紐約的私人基金會西蒙斯基金會資助。
研究人員還在挖掘 arXiv 儲存庫,以研究科學家如何交流他們的工作。本月早些時候,金斯帕格和康奈爾大學物理學研究生丹尼爾·西特隆報告了科學家重複使用其他論文文字的頻率,方法是分析 1991 年至 2012 年在 arXiv.org 上發表的約 757,000 篇文章中 7 個詞的短語的重疊情況。其他研究人員正在挖掘 arXiv 文章,以 繪製趨勢圖,瞭解科學思想的受歡迎程度,就像谷歌圖書的數字化使人文學科的研究人員能夠發現英語文學中特定短語的出現頻率一樣。
金斯帕格說,一百萬篇文章是一個自然的里程碑,但物理學家可能更喜歡其他數字標誌。“1,000,000 的意義僅僅在於我們恰好有 10 個手指的 10 進位制,而有些人會認為 2^20 = 1,048,576 是一個更重要的數字,”他說。“這也是兆位元組中的位元組數。”
金斯帕格不必等太久——按照目前的增長速度,該網站應該會在夏天達到這一點。
本文經許可轉載,並於 2014 年 12 月 30 日 首次發表。