機器學習演算法量化天文學中的性別偏見

計算表明,女性為第一作者的論文引用率被壓低了 10%

加入我們的科學愛好者社群!

來自瑞士蘇黎世聯邦理工學院的研究人員估計,由於性別偏見,第一作者為女性的論文比第一作者為男性的論文的引用率低約 10%。

引用模式中的性別差異之前已在科學領域中被記錄。但研究人員以前沒有嘗試量化差異中有多少是性別偏見造成的。例如,男性和女性可能會發表不同型別的論文;女性可能在不同的科學領域工作,並且可能擔任較低級別的職位。

但是,這篇尚未經過同行評審,並於 10 月 27 日釋出在 arXiv 預印本伺服器上的新論文,試圖解釋和糾正這些因素。作者拒絕就該論文發表評論,因為他們希望將其提交給《自然天文學》。但其他專家表示,該分析似乎是可靠的。


關於支援科學新聞

如果您喜歡這篇文章,請考慮透過訂閱來支援我們屢獲殊榮的新聞工作。透過購買訂閱,您正在幫助確保關於塑造當今世界的發現和想法的具有影響力的故事的未來。


印第安納大學布盧明頓分校的資訊學家卡西迪·杉本(Cassidy Sugimoto)表示:“這篇論文的新穎之處在於,它駁斥了引用中的性別差異可以歸因於論文的具體內容,而不是性別本身的說法。”杉本也發表了關於科學出版物中性別偏見的研究,並表示該論文的發現“既可怕又棒極了”。

估算性別偏見

為了進行研究,研究人員分析了 1950 年至 2015 年間 5 種期刊中的 20 萬篇論文。首先,他們訓練了一種機器學習演算法,以儘可能多地使用與性別無關的因素——例如論文發表的期刊、領域和年份、第一作者所在的位置以及該作者發表論文的年數——來準確計算男性為第一作者的每篇論文的引用次數。

然後,他們將演算法應用於女性為第一作者的論文。這組論文(從 1985 年起)實際上比男性作者的論文少獲得了大約 6% 的引用次數。但該演算法預測,這些論文應該比男性作者的論文多獲得 4% 的引用次數。

作者表示,該結果是他們衡量性別偏見的“最佳努力”,但他們的結果應謹慎對待,因為其他因素可能需要納入他們的演算法中。

康涅狄格州紐黑文市耶魯天文和天體物理中心主任梅格·厄裡(Meg Urry)在瑞士研究人員進行研究時向他們提供了建議,她說:“這意味著同等質量的女性和男性將擁有不平等的記錄。”她補充說,被引用的次數較少可能會導致更少的資助、演講邀請和推薦信。“鑑於我們的招聘過程在很大程度上依賴於這些指標,女性在學術界沒有達到平等水平也就不足為奇了,”她說。

被壓低的引用

英國朴茨茅斯大學的天文學家凱倫·馬斯特斯(Karen Masters)表示,良好的引用記錄對於研究事業的進步至關重要,因此這些發現可能在一定程度上解釋了為什麼高階學術職位中女性稀缺的原因。

她說:“我曾聽人說過,除非候選人的第一作者論文有 100 次引用,否則他們不會將其列入常任教職的候選名單。所以我認為,女性的引用率下降會對她們在獲得工作候選資格方面造成真正傷害。”

這項新研究還指出,女性在第一篇論文發表後的 7 年內發表的文章比男性少 19%。英國喬德雷爾班克天文臺卓越干涉測量中心負責人、天體物理學家安娜·斯凱夫(Anna Scaife)表示,這個因素可能比低引用率更具破壞性。“博士畢業後的 4-6 年對於產生有助於他們首次申請永久職位產出至關重要,”她說。

為了解決這個問題,馬斯特斯提出了一個直接來自天文學家工具箱的解決方案。她說,女性獲得的引用次數可以乘以 1.1,以消除內在的偏見。“我們經常在天文學中觀察到的趨勢中,透過經驗來糾正這樣的系統性偏見,”她說。“所以我認為可以類似地處理這個問題。”

本文經許可轉載,並於 2016 年 11 月 4 日首次釋出

Inga Vesper is a German-British journalist based on London who specializes in climate, environment and politics. She has covered E.U. science for 10 years.

More by Inga Vesper

First published in 1869, Nature is the world's leading multidisciplinary science journal. Nature publishes the finest peer-reviewed research that drives ground-breaking discovery, and is read by thought-leaders and decision-makers around the world.

More by Nature magazine
© .