自動化歷史的初稿  

計算機可以比人類更好地判斷什麼重要(稍微好一點)

Thomas Fuchs

加入我們的科學愛好者社群!

隨著2019年接近尾聲,準備迎接對年度最重要新聞故事的無休止總結。但是到2039年,這些故事中可能只有少數會被記住:新的研究表明,預測哪些事件將載入史冊是多麼困難。

哲學家亞瑟·丹託在1965年提出,即使是最博學的人,“理想的編年史家”也無法判斷最近發生的事件的最終意義,因為它取決於尚未發生的連鎖反應。賓夕法尼亞大學的計算社會科學家鄧肯·瓦茨長期以來一直想檢驗丹託的觀點。當哥倫比亞大學歷史學家馬修·康納利建議分析1973年至1979年間傳送的兩百萬份解密的國務院電報,以及其中0.1%被證明是歷史上最重要的電報的概要(由歷史學家在電報傳送幾十年後編纂)時,他得到了機會。

康納利、瓦茨及其同事首先根據元資料(例如電報的緊急程度或保密程度)對每份電報的“感知到的同期重要性”(PCI)進行了評分。他們在9月份的《自然·人類行為》雜誌上報告說,這個分數與後來被納入概要的程度只有微弱的相關性:得分最高的電報被納入的可能性僅比得分最低的電報高出四個百分點。最常見的預測錯誤是假陽性——電報得分很高,但後來被證明不重要。“我確實認為存在一種當下的自戀,”康納利說。“我驚訝於體育迷們有多少次說,‘這必將載入史冊。’”


關於支援科學新聞

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您將有助於確保未來能夠繼續報道關於塑造我們當今世界的發現和想法的具有影響力的故事。


接下來,瓦茨說,為了接近理想的編年史家,科學家們決定“構建我們能構建的最強大、最先進的機器學習模型,並將所有東西都投入其中——所有的元資料,所有的文字。”結果,人工智慧演算法顯著優於人類的同期判斷。在衡量其挑選出後來被認為重要的電報的能力的統計指標中,其中1表示沒有不正確的包含或排除,它的得分為0.14,而PCI的得分為0.05。儘管該演算法的效能遠非完美,但研究人員認為,這樣一種“人工智慧檔案管理員”可能有助於縮小為後代突出顯示的事件範圍。當針對此目的進行調整時,他們的模型篩選掉了96%的電報,同時保留了最終被納入概要的電報中的80%。

耶魯大學社會學家艾米麗·埃裡克森沒有參與這項新研究,她說,儘管這項研究使用了不完善的資料——例如,概要的納入取決於少數歷史學家的主觀判斷——但該研究提供了一個實用的工具,並解決了丹託的假設。“看到對這個概念難題進行機器學習實證檢驗真的很令人興奮,”她說,“而且思考起來也很有趣。”

© .