出售:“此處是您的名字”——在著名科學期刊上

一項針對某些科學論文的調查發現了令人擔憂的違規行為

克勞斯·凱澤 (Klaus Kayser)出版電子期刊的時間如此之久,以至於他還記得用軟盤郵寄給訂閱者。他19年的經驗讓他敏銳地意識到了科學欺詐的問題。在他看來,他採取了非常措施來保護他目前編輯的期刊《診斷病理學》(Diagnostic Pathology)》。例如,為了防止作者試圖將網際網路上的顯微鏡影像冒充為自己的影像,他要求他們同時傳送原始玻片。

然而,儘管他保持警惕,但《診斷病理學》上發表的一些文章中還是出現了一些可能的研究不端行為跡象。例如,在2014年5月刊的16篇文章中,有6篇包含可疑的短語重複和其他違規行為。* 當《大眾科學》告知凱澤時,他顯然沒有意識到這個問題。“沒人告訴過我這件事,”他說。“我非常感謝你。”

《診斷病理學》施普林格 (Springer)所有,被認為是信譽良好的期刊。在凱澤的管理下,其“影響因子”——一種粗略衡量期刊聲譽的指標,由文章在已發表的科學文獻中被引用的次數生成——為 2.411,這使其穩居湯森路透在其《期刊引用報告》(Journal Citation Reports)中跟蹤的所有科學期刊的前四分之一,並在76種病理學期刊中排名第27位。


關於支援科學新聞報道

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您將幫助確保有關塑造我們今天世界的發現和想法的具有影響力的故事能夠擁有未來。


凱澤的期刊並非孤例。在過去幾年中,同行評審文獻中也出現了類似的舞弊跡象,遍及整個科學出版界,包括威立 (Wiley)、公共科學圖書館 (Public Library of Science)、泰勒-弗朗西斯 (Taylor & Francis) 和自然出版集團 (Nature Publishing Group)(《大眾科學》的出版商)旗下的期刊。

明顯的欺詐行為發生在科學出版和研究領域正在經歷快速變革之際。科學家們將發表文章視為晉升、獲得終身職位或透過資助獲得支援的途徑,他們比以往任何時候都更努力地競爭,以使其文章進入同行評審期刊。科學期刊在網路上激增,但即便如此,供應仍然無法跟上對受人尊敬的科學出版物日益增長的需求。令人擔憂的是,這種壓力可能會導致作弊。

可疑論文不容易被發現。單獨來看,每篇研究文章似乎都是合法的。但在《大眾科學》對100多篇科學文章中使用的語言進行分析的調查中,我們發現了一些令人擔憂的模式——這似乎是在工業規模上試圖玩弄同行評審系統的跡象。

例如,其中一篇發表在2014年5月《診斷病理學》上的文章表面上看起來像是對同行評審文獻的典型薈萃分析。其作者——來自中國廣西醫科大學的八位科學家——評估了稱為XPC的基因的不同變異是否與胃癌有關。他們沒有發現這種聯絡,並承認他們的論文並不是該問題的最終定論

“然而,有必要使用標準化的、無偏倚的基因分型方法、同質的胃癌患者和良好匹配的對照組進行大樣本研究。此外,還應在分析中考慮基因-基因和基因-環境相互作用。考慮到這些因素的研究最終可能會使我們更好地全面瞭解XPC多型性與胃癌風險之間的關聯。”

對於一篇完全普通的論文來說,這是一個完全正常的結論。沒有任何應該拉響警報的地方。然而,將其與一篇幾年前發表在《歐洲人類遺傳學雜誌》(European Journal of Human Genetics)(由自然出版集團所有)上的論文進行比較,該論文是對稱為CDH1的基因變異是否可能與前列腺癌 (PCA) 相關的薈萃分析

“然而,有必要使用標準化的、無偏倚的方法、同質的 PCA 患者和良好匹配的對照組進行大型試驗,評估者對資料視而不見。此外,還應在分析中考慮基因-基因和基因-環境相互作用。考慮到這些因素的研究最終可能會使我們更好地全面瞭解CDH1-160 C/A 多型性與 PCA 風險之間的關聯。”

措辭幾乎完全相同,甚至包括笨拙的短語“使我們更好地全面瞭解”。唯一實質性的區別是特定的基因(CDH1 而不是 XPC)和疾病(胃癌而不是 PCA)。

這不是簡單的剽竊案例。許多看似獨立的研究團隊一直在剽竊相同的段落。《PLoS ONE》上的一篇文章最終可能會“使我們更好地全面瞭解”XRCC1基因突變與甲狀腺癌風險之間的關聯。另一篇發表在《國際癌症雜誌》(International Journal of Cancer)(由威立出版)上的文章最終可能會“使我們更好地全面瞭解”XPA基因突變與癌症風險之間的關聯——等等。有時措辭略有不同,但在我們發現的十幾篇文章中,幾乎相同的語言,只是將不同的基因和疾病似乎隨意地塞進段落中,就像一種深奧版本的文字接龍游戲,參與者在段落中填寫缺失的單詞。

我們還發現了其他“填空式”研究的例子。搜尋短語“因明顯不相關而被排除”檢索到十幾篇各種型別的研究文章——幾乎所有文章都由來自中國的科學家撰寫。“使用標準化表格,來自已發表研究的資料”也產生了十幾篇研究文章,全部來自中國。“Begger's funnel plot”獲得了數十個點選,全部來自中國

“Beggers funnel plot”尤其具有啟發意義。根本不存在 Beggers funnel plot。“它不存在。這就是重點,”西班牙巴塞羅那基因組調控中心 (Center for Genomic Regulation) 的生物學家紀堯姆·菲利翁 (Guillaume Filion) 說 (pdf)。一位名叫科林·貝格 (Colin Begg) 的統計學家和另一位名叫馬蒂亞斯·埃格 (Matthias Egger) 的統計學家各自發明瞭用於查詢偏差(悄悄潛入薈萃分析中的偏差)的測試和工具。“Begger's funnel plot”似乎是這兩個名字的偶然混合體。

菲利翁意外地發現了“Begger's”測試的激增。在尋找醫學期刊文章的趨勢時,他發現了一些論文,這些論文的標題幾乎相同,圖形選擇相似,並且存在相同的古怪錯誤,例如“Begger's funnel plot”。他認為這些論文來自同一來源,即使它們表面上是由不同的作者組撰寫的。“很難想象 28 個人會獨立發明一種統計測試的名稱,”菲利翁說。“這就是為什麼我們非常震驚。”

快速網際網路搜尋發現了一些機構,它們提供有償安排在同行評審出版物上發表論文的作者身份。他們似乎迎合了那些尋求快速、骯髒的方式在著名的國際科學期刊上發表文章的研究人員。

11 月,《大眾科學》要求一位講中文的記者聯絡美達中國 (MedChina),該公司提供數十個科學“待售主題”和科學期刊“文章轉讓”協議。記者冒充購買科學作者身份的人,與美達中國的代表進行了交談,後者解釋說,論文或多或少已被同行評審期刊接受;顯然,只需要進行一些編輯和修改。價格部分取決於目標期刊的影響因子以及論文是實驗性的還是薈萃分析的。在這種情況下,美達中國的代表提供了在一本影響因子為 3.353 的期刊上發表一篇將蛋白質與乳頭狀甲狀腺癌聯絡起來的薈萃分析的作者身份。費用:93,000 元人民幣——約合 15,000 美元。

美達中國代理論文最有可能的目標出版物是《臨床內分泌學》(Clinical Endocrinology)。它是影響因子為3.353的五種期刊之一,並且在主題 matter 上最接近。“顯然,這是一個非常令人擔憂的問題,”該期刊的高階編輯約翰·貝文 (John Bevan) 說。“一想到這種情況正在發生並充斥市場,我就感到沮喪。”在《大眾科學》聯絡貝文大約兩週後,他確認一篇關於乳頭狀甲狀腺癌生物標誌物的可疑文章——並且在論文修改期間添加了一位作者——已被識別並拒絕。

這些可疑論文的大部分資金來自中國政府。在《大眾科學》確定的前 100 篇論文中,有 24 篇獲得了中國國家自然科學基金委員會 (NSFC) 的資助,NSFC 是一個政府資助機構,大致相當於美國的國家科學基金會 (National Science Foundation)。另有 17 篇承認獲得其他政府來源的資助。楊衛,國家自然科學基金委員會主席,證實《大眾科學》確定的 24 篇可疑論文隨後已轉交給基金委員會的紀律檢查、監察、監督和審計局 (pdf),該局每年調查數百起不端行為指控。“國家自然科學基金委員會每年都會對研究不端行為採取數十項紀律處分,儘管代寫論文的案例不太常見,”楊衛透過電子郵件表示。去年,該機構的一項紀律處分涉及一位從網際網路站點購買資助申請書的科學家。楊衛強調,該機構採取措施打擊不端行為,包括最近安裝了針對資助申請書中可能存在的剽竊行為的“相似性檢查”。(楊衛聲稱,自該系統上線一年以來,在約 150,000 份資助申請書中,該檢查發現了數百起“高度相似”的案例。)但當談到論文工廠時,楊衛說,“我們在這方面沒有太多經驗,當然很樂意聽取您的建議。”

一些出版商現在才開始意識到中國論文工廠的問題。“我不知道存在一個作者身份的市場,”BioMed Central 研究誠信副編輯主任吉吉莎·帕特爾 (Jigisha Patel) 說。現在 BioMed Central(由施普林格所有,並出版《診斷病理學》)已注意到這個問題,帕特爾說,“我們現在可以調查並解決它了。”在《大眾科學》聯絡 BioMed Central 兩週內,BioMed Central 宣佈已識別出大約 50 篇手稿,這些手稿已由虛假同行評審員評估透過。該出版商告訴 Retraction Watch 部落格,“可能涉及第三方,並且正在影響同行評審過程。” 這些手稿可能來自論文工廠。我們得以檢視大約六篇論文的標題和作者。所有論文的風格和主題 matter 似乎都與其他論文工廠撰寫的薈萃分析非常相似,而且所有論文都來自中國作者組。

其他出版商已開始打擊大量可疑論文。《PLoS ONE》編輯主任達米安·帕丁森 (Damian Pattinson)表示,該期刊於去年四月設立了保障措施。“[E]我們收到的每篇薈萃分析都必須經過特定的編輯檢查……”這迫使作者提供更多資訊,包括他們最初進行這項研究的原因的理由,他說。“因此,實際上能夠到達評審員手中的論文的比率下降了約 90%。因此,我們非常清楚這個問題。”即便如此,《大眾科學》編制的清單中包含四篇可疑論文,這些論文是在保障措施實施後發表在《PLoS ONE》上的,並且在撰寫本文時,美達中國將一篇即將發表的《PLoSONE》文章的作者身份掛牌出售。當我們向帕丁森詢問這些時,他回答說:“如果有任何不端行為的跡象,我們將更正和撤回論文。這是一個問題問題,我們非常清楚。”

BMC、公共科學圖書館和其他出版商使用剽竊檢查軟體來嘗試減少欺詐行為。帕特爾警告說,然而,軟體並不總是能解決期刊中的剽竊問題,論文工廠“為問題增加了另一層複雜性。這非常令人擔憂。”

出版商目前正在進行一場艱苦的戰鬥。《臨床內分泌學》的貝文說,“如果沒有內幕訊息,就很難監管這件事”。《臨床內分泌學》及其出版商威立正試圖彌補編輯過程中的漏洞,以標記作者身份的可疑後期更改和其他違規行為。“你必須接受人們是以誠實和善意提交稿件的,”貝文說。

這就是根本威脅。現在許多公司已經弄清楚如何從科學不端行為中賺錢,那麼誠實的推定就有可能成為過時之物。“整個同行評審系統都建立在信任的基礎上,”帕丁森說。“一旦這種信任受到破壞,同行評審系統就很難處理。”

“我們這裡遇到了問題,”菲利翁說。他認為洪流才剛剛開始。“有如此大的壓力和如此多的金錢利害關係,以至於我們將在未來看到各種各樣的過度行為。”

巴黎·劉 (Paris Liu) 補充報道。

以下列表是 100 篇已發表的文章,這些文章似乎具有填空式科學的特徵。列入此列表並不意味著任何給定的文章都是由論文工廠撰寫的,也不意味著該文章肯定是抄襲的。然而,鑑於寫作模式以及這些文章與先前發表的作品的相似之處,我們認為它們值得出版商仔細審查。>>檢視列表

還有更多可疑文章;而且每天都有更多文章發表。這些只是我們找到的前 100 篇。

*更正 (2015 年 2 月 13 日):此句子在釋出後經過編輯。原文引用了 《診斷病理學》 2014 年 5 月刊中文章的數量為 14 篇。  

延伸閱讀
菲利翁,紀堯姆。“PubMed 上大量抄襲者。

奧蘭斯基,伊萬。“出版商發現 50 篇涉及虛假同行評審員的手稿。

約安尼迪斯,J.P.A.、張 C.Q.、林 T.K.、舒利 S.D.、庫裡 M.J.“基因組時代中國薈萃分析的幾何增長。《PLoS ONE》 8(6): e65602。doi:10.1371/journal.pone.0065602

赫維斯滕達爾,馬拉。“中國的出版集市。”《科學》(Science),2013 年 11 月 29 日,第 1035–1039 頁。DOI: 10.1126/science.342.6162.1035
 

© .