分析和生成文字的人工智慧程式正在改變我們閱讀和學習的方式。為了解析寫作,人工智慧模型會搜尋文字線索,例如詞語選擇,以瞭解它們之間的聯絡。但是,當這些線索被故意模糊和令人困惑時會發生什麼?當我挑戰人工智慧開發者解決近百年前的《凱恩的下巴骨》,一本1934年的謀殺謎題書時,我試圖回答這個問題。
這本書神秘地進入了我的生活,就像一個文學偵探所希望的那樣。2022年10月的一個下午,一個來自亞馬遜的隨機包裹被扔到了我的家門口,沒有附帶任何便條或退貨地址。我從未聽說過裡面的這本書,但谷歌搜尋告訴我,《凱恩的下巴骨》既是一部謀殺懸疑小說,又是一個令人絞盡腦汁的謎題。這本書出版時故意將所有頁面都弄亂了;為了破解案件,讀者必須首先重新排列頁面,然後說出六名兇手及其受害者的名字。
這個邪惡情節的作者是(驚喜驚喜)一位謎題專家。愛德華·馬瑟斯曾以筆名託奎瑪達為《觀察家報》編制縱橫字謎。他在偵探小說所謂的黃金時代的高峰期出版了《凱恩的下巴骨》,但只有兩個人成功破解了它,之後這本書就絕版了。2019年,出版平臺Unbound Publishing的聯合創始人約翰·米欽森在英國的一家文學博物館偶然發現了一本故事副本及其解答。米欽森決定重印這本100頁的謎題。“我說,‘哇,這太棒了。這是一部偵探小說,那麼把它整理好會有多難呢?’”他回憶道。
支援科學新聞報道
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保未來能夠繼續講述關於塑造我們當今世界的發現和思想的有影響力的故事。
事實證明,答案是“非常非常困難”。在過去的幾年裡,只有另外四個人解開了這個謎題。然後這本書在TikToker的幫助下爆紅,他們試圖用一面色彩繽紛的“謀殺牆”重新排列頁面。它的新流行促使米欽森在最初的5000冊印刷基礎上加印了更多副本。
當我的《凱恩的下巴骨》副本出現時,我們沒有為這些頁面指定牆面空間,而是將它們鋪在了我們家的客床上。在一個昏暗的夜晚,當我們仔細研究那些華麗而又故意模糊的語言時,我建議使用人工智慧演算法來解決這部小說。
嘗試解決《凱恩的下巴骨》。圖片來源:奧斯汀·休斯
因為我不是軟體專家,所以我開始尋找一家願意解決這個謎題的人工智慧公司。但是大多數人工智慧都沒有經過專門訓練來重新排列書頁,或者分析20世紀30年代英語的語言怪癖。最後,我聯絡了Zindi,這是一家總部位於非洲的公司,該公司舉辦人工智慧競賽,5萬名資料科學家使用演算法來解決謎題並贏得獎品。Zindi對舉辦比賽很感興趣,在Unbound的許可下,我建立了2022年凱恩的下巴骨謀殺謎題競賽;我們將這本90年前的書數字化,並挑戰世界使用自然語言處理(NLP)演算法來重新排列頁面。
自然語言處理演算法,例如著名的ChatGPT,試圖透過將其上下文和語言與接收到的訓練資料進行比較來理解文字中的資訊。這些演算法可以透過將每個單詞轉換為“標記”,然後分析每個標記如何融入完整作品中,來分析從未見過的文字。這有助於人工智慧演算法快速有效地分析文字,無論是文學作品還是科學報告。我高尚地抵制了使用人工智慧來破解是誰寄給我這本有趣的書的謎題,而是給朋友發簡訊並在Instagram上發帖來找出罪魁禍首。
對於我們的比賽,參與者從谷歌開發的現有NLP模型BERT開始,該模型在開源庫中可用,可以在其中針對特定用途進行修改。“這些模型……在模型建立者可以獲得的大量資料上進行訓練,然後進行改進以遵循一組特定的指令,”南加州大學計算機科學研究副教授喬納森·梅說。為了改進他們的模型以用於這種特定用途,我們給參與者提供了阿加莎·克里斯蒂的第一部偵探小說《斯泰爾斯莊園奇案》,作為訓練資料使用,因為這個故事與《凱恩的下巴骨》寫於同一時期,包含類似的語言,並展示了經典謎題的語境線索。
人工智慧與創作小說,包括謀殺懸疑小說,有著悠久的歷史。1973年,計算機科學家謝爾頓·克萊因提出了自動小說作家,他聲稱該程式可以在不到20秒的時間內創作出2100字的謀殺懸疑故事。從那時起,程式設計師和工程師使用更多的資料改進了這些模型的輸出。“在某種程度上,謀殺懸疑小說很容易,”英國開放大學教育技術研究所名譽教育技術教授邁克·夏普爾斯說。“它有一個標準的故事情節結構:找到屍體,偵探來了,你得到了一個障眼法,等等。”這種故事情節結構不僅對匆忙創作故事的作者有幫助,而且還可以幫助人工智慧語言程式嘗試將這些故事的亂序頁面放回正確的順序——理論上是這樣。
不幸的是,《凱恩的下巴骨》為語言分析演算法創造了終極挑戰:故事不僅完全亂序,而且旨在難倒讀者。例如,語言高度風格化——米欽森將其描述為“後現代主義詩歌”——並且故意模糊,以使頁面排序儘可能困難。此外,故事中充斥著虛假線索,例如某些角色的假名和其他角色的誤導性名稱,所有這些都可能使人工智慧模型以及人類解謎者感到困惑。結果,沒有一位人工智慧開發者成功破解了這個謎題——儘管他們中的一些人取得了一些進展。
來自南非的計量經濟學家M.G.費雷拉是人工智慧競賽的獲勝者之一,他的得分最高,為42分。這意味著他的程式正確排列了Unbound允許我們用於比賽的70頁中的42頁。“自然語言處理確實具有一定的理解能力,比如知道雷聲和雨水是相關的,”費雷拉說。“但這裡的問題是,這本書試圖用虛假線索來迷惑你。它打破了自然語言處理的理解能力。”為了解決這個謎題,他解釋說,人工智慧需要人類介入,檢視上下文並識別哪些想法是相關的。“朝著這個方向發展,最終我們將能夠解決整個問題。但是到那時,自然語言處理將只佔很小一部分,而人類的疊加將佔很大一部分,我會稱之為機器輔助,”他補充道。*
謀殺謎題競賽揭示,當前的人工智慧語言程式可能能夠完成令人印象深刻的壯舉,但它們不會很快與波洛正面交鋒。這些模型不擅長分析沒有上下文的事物,這可能會給希望使用自然語言處理來分析古代語言的研究人員帶來問題。由於關於一些早已消失的文明的歷史記錄很少,缺乏上下文使得人工智慧很難學習如何翻譯他們失落的語言。
至少這次經歷幫助我解決了一個謎題:我追蹤到了寄給我這本書並讓我開始解決這個謎題的人。罪魁禍首原來是我小學時代的朋友之一,一個沒有社交媒體但確實對謀殺懸疑小說有偏愛的人——就像我一樣。
這是一篇觀點和分析文章,作者或作者表達的觀點不一定代表《大眾科學》的觀點。
*編者注(8/31/23):此段落已在釋出後編輯,以更正對《凱恩的下巴骨謀殺謎題競賽》中使用的頁數的描述。
本文的標題為“謀殺謎題”,經過改編後收錄在2023年11月刊的《大眾科學》雜誌中。
