本文發表於《大眾科學》的前部落格網路,反映了作者的觀點,不一定代表《大眾科學》的觀點
關於支援科學新聞事業
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞事業 訂閱。透過購買訂閱,您將幫助確保未來能夠繼續講述關於塑造我們當今世界的發現和想法的具有影響力的故事。
如何量化一篇特定科學論文的重要性?一種簡單且常用的衡量標準是該論文在後續出版物中被引用的次數。但批評者指出,引用計數有利於生物學等學科,因為這些學科的論文往往被引用更多,而不利於數學等引用較少的領域。此外,來自相對邊緣論文的引用與來自在知名期刊上發表文章的頂尖研究人員的引用具有相同的權重。
在一項研究中,該研究於十月發表在《神經科學雜誌》,並最近在線上知識庫arxiv.org上提供,布魯克海文國家實驗室的物理學家Sergei Maslov和波士頓大學的Sidney Redner研究了谷歌的PageRank演算法在科學著作排名中的價值。(研究人員正確地指出,沒有哪個定量系統能夠真正“評估”科學著作的價值——但由於許多這樣的指標已經被使用,因此理應對其進行改進。)
他們的PageRank版本沒有使用超連結,而是將期刊引用作為假設網路的基本連結。透過在這個網路中從一個節點隨機移動到另一個節點,PageRank為連線更好的論文賦予更高的排名——也就是說,被反過來又被頻繁引用的論文引用的論文。它還考慮了不同學科不同的引用習慣——一篇引用少量參考文獻的論文,其引用在PageRank演算法中比一篇引用數十篇過去著作的論文賦予更高的價值。
物理學家對谷歌演算法做了一個修改:提高“厭倦因子”,在這個因子下,假想的網路衝浪者被認為會放棄:一個網路使用者可能會在移動之前跟蹤六個超連結的鏈條,而一個在科學文獻中挖掘的研究人員可能只會回溯兩步。
湯森路透科學業務部門的首席科學家Henry Small表示,PageRank方法是最近湧現的眾多方法之一,因為越來越多的資訊可以在網上獲得,湯森路透是一家同行評審出版資料的主要提供商。
他說:“這個領域在過去五年左右的時間裡確實爆炸式增長。” 他指出,儘管諸如引用計數等標準方法可能不是衡量科學影響力的完美指標,“但所有這些方法都有其權衡之處。”
應用於美國物理學會的物理期刊,包括著名的《物理評論快報》,PageRank 揭示了一系列物理學界名人,包括一些諾貝爾獎獲得者。正如 Small 指出的那樣,問題在於 PageRank 具有一定的“時間滯後效應”。他說,雖然該演算法“擅長識別經典論文”,但一篇重要的論文可能需要數年時間才能建立足夠廣泛的引用連結網路,從而躍升到 PageRank 的較高層級。
Maslov 和 Redner 透過引入對較新論文的指數偏好來糾正這種影響——有趣的是,這個因素似乎使結果與傳統的引用計數更加一致。您可以在 Maslov 的網頁上測試他們調整後的演算法,稱為 CiteRank,在 Maslov 的網頁上。
圖片 ©iStockphoto.com/Felix Möckel