為什麼資料科學反對穆斯林禁令

有些人依賴“常識”將整個宗教打上危險的標籤——但嚴謹的分析證明他們是錯誤的

加入我們的科學愛好者社群!

本文發表於《大眾科學》的前部落格網路,反映了作者的觀點,不一定反映《大眾科學》的觀點


編者注(2018年6月26日):《大眾科學》重新發布以下文章,該文章最初於2017年6月14日釋出,鑑於美國最高法院以5票對4票的裁決維持了特朗普政府的旅行禁令,該禁令阻止來自幾個穆斯林佔多數國家的旅客進入美國。

讓我們不要失去科學的頭腦。隨著白宮的旅行禁令向美國最高法院推進以尋求可能的批准,讓我們從科學的角度看看這對安全是否有意義。資料是否支援該禁令的基本假設,即禁止穆斯林——至少是來自某些國家的穆斯林——會降低恐怖主義風險?

這個問題亟待解決,但誰最適合解決這個問題呢?資料科學領域擁有管轄權。它是一門學科,旨在透過基於經驗、基於事實的見解來改進運營決策——這些決策通常是憑直覺和直覺做出的。資料科學已經承擔起執行我們日益資料驅動的世界的廣泛角色。它驅動政府和商業的安全篩選,包括預測性警務、評估罪犯的假釋決定和檢測欺詐性交易。(該領域不僅擴充套件到安全領域,還擴充套件到最佳化營銷、線上廣告、金融信貸風險、醫療保健等。)資料科學也適用於改進恐怖分子的篩選。因此,如果穆斯林作為一個群體構成了值得禁止的安全風險,那麼資料科學就會證明這一點。


支援科學新聞報道

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保有關塑造我們當今世界的發現和想法的具有影響力的故事的未來。


然而,從資料科學的角度來看,穆斯林禁令會削弱安全,而不是加強安全——即使只適用於有限的幾個國家。事實上,大多數資料科學家反對這樣的禁令。不幸的是,定量分析的棘手陷阱導致一些人得出相反的結論。因此,儘管當今資料使用的增長為組織決策做出了巨大貢獻,但如果資料被解讀為支援禁令,那麼它只會增加宗教平等方面的不確定性。以下是導致人們誤解資料以支援穆斯林禁令的三個分析陷阱

首先,人們過度“切片和剖析”資料。根據資料的選擇方式,恐怖主義資料庫的某些部分可能會錯誤地顯得有理由進行基於宗教的安全篩選。如果一個精心挑選的資料樣本將穆斯林指定為最有可能實施恐怖行為的人,那麼另一個樣本可能會將他們指定為最不可能實施恐怖行為的人。這取決於您包含哪些記錄進行分析。

例如,可以根據襲擊國家、嫌疑人原籍國、入境依據(難民、學生、未婚夫等)和時代(例如,9/11事件前後)選擇恐怖事件樣本進行分析。不同的樣本會得出不同的結論,事實上,關於穆斯林實施恐怖主義的比例的已發表報告彼此存在分歧,原因就在於此。巧合的是,資料科學家們親切地將這種操縱描述為“拷問資料直到它認罪”。

其次,人們誤判了個人移民帶來的風險。即使不同宗教之間的暴力風險差異很大,任何一個人成為恐怖分子的機率仍然很小。這是因為在任何主要宗教中,絕大多數人永遠不會從事恐怖主義活動。假設在切片和剖析之後,資料顯示來自特定國家的特定宗教的移民在過去10年中從事恐怖主義活動的機率是平均水平的五倍。(這種趨勢確實存在,因為主要宗教以其名義進行的恐怖主義頻率會隨著時間的推移而上升和下降。)即使在這樣一個群體中,任何一個人的機率也仍然非常小——在大多數情況下低於0.01%。對於任何主要宗教,個人成員都不是特別危險的。

第三,按宗教篩選只會削弱預測誰是恐怖分子的能力。說人是由他們的行為定義的——由他們做什麼而不是他們屬於哪個類別定義的——不僅僅是哲學上的說法。在實際應用中,資料科學反覆表明,人們先前的行為比人口統計資料資料更準確地預測未來的行為。

因此,可以透過從開放式的行為資料範圍中收集更多元素來不斷改進任何移民篩選流程,包括個人和職業活動以及金融交易。無數尚未被發現的行為模式會比不加區分地按人口類別篩選抓獲更多的恐怖分子。由於宗教等類別提供的關於未來行為的資訊較少,因此將其作為因素納入只會分散分析數字運算(即預測建模)的注意力,使其無法精準地找到透過先前的行為進行篩選的最佳方法。這樣做還會加強政府工作人員中現有的偏見,並降低行為資料的重要性。

公民權利的視角進一步支援了行為比宗教更具預測性的立場。穆斯林禁令最能體現字面意義上的偏見:這將是完全基於受保護群體宗教對個人進行預先判斷的行為。宗教具有受保護群體的地位,因為我們尊重它作為一種定義屬性,它是個人身份的內在組成部分。與其他定義屬性(如種族、性別和原籍國)一樣,個人的宗教信仰與該人是否會從事恐怖主義活動最多隻有間接關係。儘管恐怖主義可能受到宗教的影響,但宗教學者認為它並非源於宗教本身。恐怖主義的原因包括社會經濟和地緣政治因素;以宗教“名義”實施的恐怖行為並不意味著它是“因為”該宗教。因此,與檢測任何可能的惡意意圖相關的是個人過去的行——而不是他或她的宗教信仰。

找準目標。與其按宗教篩選,我們必須完全專注於我們被迫預測的威脅:恐怖主義。將移民視為個體,透過該人獨特的行為背景進行評估,這種做法將更好地預測風險,從而提高安全性。相反,針對穆斯林的禁令將是一個史詩般的國家錯誤——不僅在社會公正方面,而且在安全方面也是如此。

Eric Siegel, PhD, is the author of Predictive Analytics: The Power to Predict Who Will Click, Buy, Lie or Die, Revised and Updated Edition (Wiley, January 2016), founder of the Predictive Analytics World conference series, executive editor of The Predictive Analytics Times, and a former computer science professor at Columbia University.

More by Eric Siegel
© .