在今天的刑事司法系統中,有超過 400 種演算法 在市場上流通,為量刑和假釋等重要的法律決策提供資訊。就像保險公司 使用演算法來設定保費 一樣,法官使用風險評估演算法來估計某人在判處監禁時再次犯罪的可能性。一般來說,與高風險罪犯相比,低風險罪犯可以並且確實會獲得較短的刑期。
科學家和法律倡導者 批評 這些演算法的使用,認為它們 帶有種族偏見,操作方式不透明,並且對於應該區別對待每個人的刑事司法系統來說過於籠統。然而,很少有人關注 這些演算法是如何變成這樣的 ——它們是如何在投入使用之前被開發和驗證的。就兒童色情犯罪者而言,心理學專家在刑事司法系統中廣泛使用一種演算法,但很少考慮其開發,更重要的是,其準確性。鑑於兒童色情犯罪的嚴重後果,使用未經驗證且準確性未知的演算法是危險的。
該演算法被稱為 兒童色情犯罪者風險工具 (CPORT)。佐治亞州使用 CPORT 來確定哪些被判犯有性犯罪的罪犯應被列入公開的性犯罪者登記冊,專家們通常在全國各地的量刑聽證會上就 CPORT 風險評估的結果作證。人們可能會認為有可靠的科學證據支援 CPORT 在美國罪犯身上的有效性。這種假設是不正確的。
支援科學新聞報道
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保關於塑造我們今天世界的發現和想法的具有影響力的故事的未來。
去年,我們發表了 對 CPORT 的詳細方法論批判。除其他外,我們注意到用於開發該工具的樣本非常小。CPORT 是透過研究來自加拿大安大略省的 266 名兒童色情犯罪者開發的,這些犯罪者在 1993 年至 2006 年期間獲釋。在獲釋後的五年內,有 29 名罪犯被指控或被判犯有新的性犯罪。
基於 29 名再犯者開發演算法是令人擔憂的,因為 小樣本量使統計模型不穩定 並且無法推廣到更廣泛的兒童色情犯罪者群體。其他眾所周知的風險因素,例如 接觸兒童 或專注於兒童色情,在這個樣本中不是預測性風險因素,因此未包含在 CPORT 中。
更重要的是,鑑於自 2006 年以來用於訪問、儲存和傳輸兒童色情內容的技術發生了巨大變化——CPORT 開發樣本就是在那時收集的,CPORT 的開發資料可能已經過時。手機和其他網際網路技術直到 2006 年之後才得到廣泛使用,這極大地 改變和擴大了線上兒童色情犯罪的發生方式。訪問網際網路是兒童色情犯罪者的 常見特徵,但它未包含在 CPORT 中。
相比之下,公共安全評估演算法(法官使用該演算法來確定被指控的人在等待審判期間再次犯罪的風險)是透過分析來自美國各地 300 多個司法管轄區 的數千名被告的資料建立的。重要的是,它在投入使用前已在當地司法管轄區 獲得驗證。如此大規模和多樣化的測試是有效風險評估的基石:即使是最有前途和 廣為人知的模型 也已被證明在 應用於新資料集時會崩潰。
與公共安全評估演算法不同,CPORT 研究人員使用來自加拿大安大略省同一司法管轄區的 80 名罪犯進行了“驗證研究”。這個樣本只有 12 名再犯者!其令人費解的結果證明了依賴小樣本的危險:當僅限於資訊完整的案例時,CPORT 分數不能預測再犯,但當包含資訊不完整的案例時,它們可以預測再犯。換句話說,當缺少相關資訊時,該演算法“有效”,但當僅限於資訊完整的案例時,該演算法無效。
我們還回顧了其他研究人員進行的研究——這是一個至關重要的步驟,因為測試開發者進行的研究往往會獲得更好的結果。測試開發者對其工具的推廣和成功具有既得利益,這可能會有意識或無意識地影響其結果。但即使是這些獨立研究也存在科學嚴謹性不足的問題。例如,一項 來自西班牙的研究只有 6 名再犯者,並且該研究在 97% 的案例中缺少資訊。所有研究均未在美國罪犯身上進行。
根據對現有研究基礎的詳盡和詳細分析,我們得出結論,“目前在美國對僅犯有兒童色情罪的罪犯使用 CPORT 是不合適的。” 相比之下,儘管 指出 “尚不清楚該量表在不同樣本/設定中的表現如何,並且目前尚無足夠的資料來產生可靠的再犯估計值”,但 CPORT 開發團隊 聲稱“該量表已準備好使用,[但] 鑑於其背後的研究基礎有限,應謹慎使用。”
在我們發表文章後,聯邦緩刑和審前服務辦公室 (PPSO) 的研究人員在美國聯邦兒童色情犯罪者的樣本中測試了 CPORT,該樣本包含 5,700 名在 2010 年至 2016 年期間獲釋的罪犯。五年內,有 5% 的人因新的性犯罪被再次逮捕。經過測試,CPORT 表現出“平庸的預測”效能,“沒有達到 CPORT 開發者報告的 [值]”。因此,PPSO 決定不使用 CPORT 來為關於對假釋中的兒童色情犯罪者進行必要監管級別的決策提供資訊。
儘管 PPSO 有調查結果、我們的批評以及在美國任何樣本中都缺乏驗證,但 CPORT 開發團隊仍然堅持認為“CPORT 可以合理用於評估風險”並正在推廣其使用。
使用未經驗證的演算法(如 CPORT)對公共安全和被告人的自由構成重大威脅。不準確的預測演算法提供了基於科學的精確性和準確性的假象。但這種假象是虛幻的,實際上,基於這些演算法的法律決策會導致重大錯誤,並帶來可怕的後果:非危險罪犯被監禁的時間超過必要時間,而危險罪犯則被釋放去犯下未來的罪行。
繼續使用未經驗證的風險評估工具也會阻礙對替代演算法的研究。證據 表明,在本地資料上開發的“本土”風險評估演算法在預測其管轄範圍內個人的再犯方面,可能比 CPORT 等“現成”演算法更準確。然而,當決策者可以立即使用已建立的東西時,建立本地開發的演算法所需的時間和資源遠遠超過了。
除非在應用風險評估演算法的司法管轄區開發併成功驗證了風險評估演算法,否則使用風險評估演算法會使我們所有人處於風險之中。
這是一篇觀點和分析文章,作者或作者表達的觀點不一定代表《大眾科學》的觀點。
