法醫專家在判斷兩個筆跡樣本是否匹配方面出人意料地出色

一項旨在反駁筆跡分析缺乏證據的研究表明,如果鑑定人員接受過正確的培訓,筆跡分析是有效的

Search alamy All images Search alamy Stainless Steel Pen Laying on Written Page

在2020年美國總統大選之後,筆跡分析研究員瑪拉·梅利諾接到一個奇怪的電話。電話中的人似乎想尋求她對一份高度可疑的報告的支援,該報告聲稱選票上的簽名存在差異。梅利諾是肯塔基州立大學的心理學教授,她提出了一些尖銳的問題。在瞭解到,簽名驗證的參與者不是受過訓練的專業人員等情況後,她得出結論,“關於這份報告的一切都是糟糕和錯誤的。”

新的研究為梅利諾的直覺提供了支援。研究發現,法醫筆跡比對是一種有效的方法,但需要多年的專業培訓,以確保在法律和行政案件中得出的結論的有效性。根據8月1日發表在《美國國家科學院院刊》上的研究結果,訓練有素的專業人員可以可靠地識別出自同一人筆跡的樣本,並在大多數時候做出正確的判斷。相比之下,受過較少訓練的人表現明顯更差。

2009年,由於擔心某些法醫技術可能存在缺陷,國家研究委員會發布了一份報告,指出對於比較犯罪現場樣本證據的方法(包括頭髮、咬痕和筆跡)的支援不足。2016年,時任總統巴拉克·奧巴馬的一個顧問小組跟進發布了一份報告,呼籲對比較技術的準確性進行更多研究。


支援科學新聞報道

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保未來能夠繼續報道關於塑造我們當今世界的發現和想法的具有影響力的故事。


梅利諾說,新的研究結果表明“這個過程的有效性和可靠性”,她沒有參與這項工作。這項研究和其他研究的結果都“指向同一個方向,那就是經過充分培訓的檔案檢驗人員在他們做出的判斷中是相當準確的。” 她補充說,越來越多的證據有助於回應批評,“即沒有研究透過實證來支援這個領域的人可以做到他們聲稱能做到的事情。”

哈佛大學物理學教授、《美國國家科學院院刊》副編輯大衛·韋茨負責監督這項工作的同行評審過程,他說他認為這項研究作為一項“對法醫分析的嚴肅科學研究”將非常重要,但他“並不總是相信法醫分析是以真正科學的方式進行的。” 《大眾科學》聯絡了這項由聯邦調查局資助的研究的四位作者,但在出版前沒有人接受採訪。

為了這項工作,86名法醫檔案檢驗人員(其中大多數是政府僱員)使用230人產生的此類書寫的數字影像進行了100次筆跡比較。在100項任務中,44項是比較同一人手寫的文件,其餘56項是比較兩個人書寫的文件。參與者不知道的是,十分之一的比較組是他們已經看過的組的重複——這是一種測試每個參與者隨時間推移的一致性的方法。

未參與這項研究的認證法醫檔案檢驗員和研究員琳達·米切爾說,法醫檔案檢驗人員根據長長的因素列表比較樣本。感興趣的特徵包括字母間距、字母的連線方式以及字母“腿”(如小寫字母“g”的尾部或小寫字母“d”的向上掃掠)在字母下方或上方的下降或上升。“有很多東西,”她說。

在聯邦調查局的研究中,檢驗人員以五種評級形式表達了他們的結論:確定同一作者寫了或未寫比較樣本,可能同一作者寫了或未寫比較樣本,或無法得出結論。

總的來說,在3.1%的案例中,檢驗人員錯誤地得出結論,認為比較樣本是由同一作者撰寫的。不同的作者(雙胞胎)更常使檢驗人員犯錯,導致誤報率達到8.7%。錯誤地歸因於兩個不同作者的樣本的漏報率甚至更低,為1.1%。

米切爾說,雙胞胎很棘手,因為相似的環境可能會在一些家庭中促成這些筆跡相似之處。“但最終,”她補充說,“總會有一些東西可以將你的筆跡與別人的筆跡區分開來。”

經驗水平影響了檢驗人員的準確性和信心。與新手相比,接受過兩年或更長時間培訓的63名檢驗人員表現更好,也更謹慎——更傾向於依賴“可能”的結論。表現最差的九名參與者是23名接受培訓較少的人員之一。“這就是培訓的意義所在:確保你知道你不知道什麼,”米切爾說。

在86名參與者中,有42人在至少一次比較中錯誤地得出結論,認為樣本來自同一作者。但核心小組的八名參與者對這些錯誤中的一半以上負責——在114個錯誤猜測中佔了61個。對於漏報,該小組在原始數字方面總體上做得更好:86人中只有17人犯了這個錯誤,而17人中的一人因做出超過五分之一的錯誤判斷而脫穎而出。

事實證明,當被要求再次審查相同的檔案時,檢驗人員相當一致,在他們審查過兩次的案例中,只有1%的案例完全推翻了判斷。他們更可能從確定轉向可能,或反之亦然,而不是完全推翻一項發現。整個小組中只有一個人在所有第二次審查中都得出了相同的結論。參與者在檢驗人員之間也表現出相似的一致性,只有1.2%的案例完全推翻了結論。

梅利諾說,表達檢驗人員意見強度的五級量表代表著一個不斷變化的指標。一些正在開發這些評估的小組已經嘗試使用多達九個級別來表達意見的強度,但外行和專家如何解讀這些發現之間存在差距,外行傾向於想要一個簡單的“是”或“否”,而不是有保留的意見。“從我所看到的,五級不夠,九級可能沒有必要,但七級可能剛剛好,”梅利諾補充道。她說,理清這一點並闡明外行如何理解這種“意見語言”可能是未來研究中最重要的事情。

© .