一位21歲的計算機科學專業的學生贏得了一項全球競賽,成功解讀了來自古羅馬城市赫庫蘭尼姆的碳化卷軸中的第一段文字。自公元79年的一次火山爆發以來,該卷軸一直無法解讀——那次火山爆發也掩埋了附近的龐貝古城。這項突破可能會開啟來自希臘羅馬古代唯一完整圖書館的數百篇文獻。
內布拉斯加大學林肯分校的盧克·法裡託開發了一種機器學習演算法,該演算法已在卷軸狀莎草紙的幾行上檢測到希臘字母,包括 πορϕυρας (porphyras),意思是“紫色”。法裡託利用表面紋理中細微的小尺度差異來訓練他的神經網路並突出顯示墨跡。
義大利那不勒斯大學的紙莎草學家,也是審查法裡託研究成果的學術委員會成員費德里卡·尼科拉迪說:“當我看到第一張影像時,我震驚了。”她說,“這真是一個夢想。” 現在,“我真的可以從卷軸內部看到一些東西了。”
支援科學新聞報道
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您將幫助確保有關塑造我們當今世界的發現和想法的具有影響力的故事的未來。
公元79年10月,維蘇威火山爆發,赫庫蘭尼姆被20米厚的火山灰掩埋,數百個卷軸被埋沒。早期開啟紙莎草紙的嘗試造成了大量的碎片,學者們擔心剩下的部分可能永遠無法展開或閱讀。“這些都是非常瘋狂的東西。它們都皺巴巴的,而且被壓碎了,”尼科拉迪說。
維蘇威挑戰賽提供了一系列獎項,最終大獎為70萬美元,獎勵解讀卷軸中四個或更多段落的人。10月12日,組織者宣佈法裡託因在紙莎草紙4平方釐米的區域內解讀了超過10個字元而贏得了4萬美元的“首批字母”獎。柏林自由大學的研究生優素福·納德獲得第二名,獎金為1萬美元。
豪華圖書館
威尼斯卡福斯卡里大學的古希臘羅馬歷史學家西婭·索默斯基爾德說,最終能看到卷軸內部的字母和單詞“非常令人興奮”。這些卷軸是在十八世紀被發現的,當時工人們偶然發現了一座豪華別墅的遺蹟,這座別墅可能屬於朱利葉斯·凱撒岳父的家族。索默斯基爾德說,解讀這些紙莎草紙可能會“徹底改變我們對古代歷史和文學的認識”。今天已知的大多數古典文字都是幾個世紀以來抄寫員反覆抄寫的結果。相比之下,赫庫蘭尼姆圖書館收錄了來自作者本人的、任何其他來源都不知道的作品。
到目前為止,研究人員只能研究開啟的碎片。已經鑑定出一些拉丁文作品,但其中大多數包含與伊壁鳩魯哲學學派相關的希臘文字。其中有伊壁鳩魯本人撰寫的《論自然》的部分內容,以及鮮為人知的哲學家費洛德姆斯關於惡習、音樂、修辭和死亡等主題的作品。有人認為,該圖書館可能曾經是他的工作收藏。但是,超過600個卷軸——大部分儲存在那不勒斯國家圖書館,少數在英國和法國——仍然完好無損且未開啟。並且在別墅的較低樓層可能還會發現更多的紙莎草紙,這些樓層尚未挖掘出來。
計算機科學家布倫特·西爾斯幫助設立了維蘇威挑戰賽,他的團隊花費多年時間開發方法,使用X射線計算機斷層掃描 (CT) 掃描“虛擬展開”薄如蟬翼的圖層,並將它們視覺化為一系列平面圖像。2016年,在肯塔基州列剋星敦的肯塔基大學的西爾斯報告說,他使用該技術解讀了來自以色列恩戈地的焦化卷軸,揭示了用三世紀或四世紀公元寫的《利未記》的部分內容——猶太教《妥拉》和基督教《舊約》的一部分。但是恩戈地卷軸上的墨水含有金屬,因此在CT掃描中會發出明亮的光芒。較舊的赫庫蘭尼姆卷軸上的墨水是碳基的,本質上是木炭和水,在掃描中與莎草紙具有相同的密度,因此根本不會顯示出來。
西爾斯意識到,即使亮度沒有差異,CT掃描也可能捕捉到微小的紋理差異,從而區分覆蓋墨水的莎草紙區域。為了證明這一點,他訓練了一個人工神經網路來讀取開啟的赫庫蘭尼姆碎片X射線影像中的字母。然後在2019年,他將法國研究所的兩個完整卷軸帶到英國牛津附近的鑽石光源(一個同步加速器X射線裝置),以迄今為止最高的解析度(每3D影像元素或體素4-8微米)掃描它們。
然而,解讀完整的卷軸仍然是一項艱鉅的任務,因此該團隊向公眾釋出了所有掃描影像和程式碼,並啟動了維蘇威挑戰賽。西爾斯說:“我們都同意,我們寧願儘快解讀裡面的內容,也不願試圖囤積一切。”
大約1500個團隊很快透過遊戲玩家聊天平臺Discord進行討論和協作。獎項分階段設計,並且每達到一個里程碑,獲勝程式碼就會發布,供所有人在此基礎上構建。法裡託從小就對歷史感興趣,並且自學了拉丁語,他很早就參與其中。
與此同時,西爾斯的團隊致力於虛擬展開,釋出展平碎片的影像供參賽者分析。關鍵時刻出現在六月下旬,當時一位競爭者指出,在某些影像上,墨跡偶爾可以用肉眼看到,這是一種細微的紋理,很快就被稱為“裂紋”。法裡託立即專注於裂紋,尋找更多字母的線索。
八月的一個晚上,他在參加一個聚會時收到警報,說釋出了一個新的片段,其中裂紋特別明顯。他透過手機連線,在他的新影像上運行了他的演算法。一個小時後走回家時,他拿出手機,在螢幕上看到了五個字母。“我當時又蹦又跳,”他說。“天哪,這真的要成功了。” 從那時起,僅用了幾天時間就完善了模型,並識別出獲得獎金所需的十個字母。
紙莎草學家們也很興奮。“紫色”這個詞尚未在開啟的赫庫蘭尼姆卷軸中被解讀出來。紫色染料在古羅馬非常受歡迎,由海螺的腺體制成,因此該術語可能指紫色、長袍、能夠負擔得起染料的人的等級,甚至是指軟體動物。但尼科拉迪說,比單個詞更重要的是解讀出任何東西。這項進展“為我們提供了恢復整個卷軸文字的潛在可能性”,包括標題和作者,以便可以識別和確定作品的年代。
看到不可見之物
倫敦谷歌DeepMind的員工研究科學家揚尼斯·阿塞爾將維蘇威挑戰賽描述為“獨特而鼓舞人心”。但他指出,這是更廣泛轉變的一部分,人工智慧 (AI) 正越來越多地幫助古代文字的研究。例如,去年,阿塞爾和索默斯基爾德釋出了一個名為伊薩卡的AI工具,旨在幫助學者們收集未識別的古希臘銘文的日期和起源,併為填補任何空白的文字提供建議。它現在每週收到數百個查詢,類似的努力也正在應用於從韓語到阿卡德語的各種語言,阿卡德語曾在古代美索不達米亞使用。
西爾斯希望機器學習能夠開啟他所謂的“隱形圖書館”。這指的是實際存在但無人能見的文字,包括中世紀書籍裝訂中使用的羊皮紙;重寫本,其中後來的文字掩蓋了下面的圖層;以及紙莎草紙盒,其中舊紙莎草紙碎片被用來製作古埃及木乃伊盒和麵具。
然而,目前,所有人的目光都集中在維蘇威挑戰賽上。大獎的截止日期是12月31日,西爾斯將氣氛描述為“毫無保留的樂觀”。法裡託本人已經在他卷軸的其他片段上運行了他的模型,並且看到了更多字元出現。
本文經許可轉載,並於2023年10月12日首次發表。
