AI破解2000年古卷 開闢考古新天地

  右圖:西爾斯博士在肯塔基大學實驗室裏指導一名學生掃描卷軸。左圖:去年,研究人員使用AI在卷軸中識別出了古希臘單詞「紫色」。/網絡圖片
  右圖:西爾斯博士在肯塔基大學實驗室裏指導一名學生掃描卷軸。左圖:去年,研究人員使用AI在卷軸中識別出了古希臘單詞「紫色」。/網絡圖片

  【大公報訊】綜合彭博社、《衛報》報道:近日,研究人員宣布,在一項名為「維蘇威挑戰」的比賽中,3名學生成功使用人工智能(AI)破解了2000年前的羅馬帝國著名卷軸文物中的部分內容,揭開了一份古代哲學著作的神秘面紗,並贏得70萬美元(約547萬港元)大獎。評論指,學生們破解「赫庫蘭尼姆古卷」,為AI技術完整破解古卷的剩餘內容鋪平了道路,這或將對人們理解古代世界產生革命性的影響。

  公元79年,意大利維蘇威火山噴發,山下繁榮的龐貝城被火山熔岩掩埋,附近的小鎮赫庫蘭尼姆也被波及。1752年,工人挖掘維蘇威火山掩埋的古代別墅時,發現約800卷被燒毀的卷軸,這批卷軸被稱為赫庫蘭尼姆古卷。多年來,科學家們都試圖識別赫庫蘭尼姆古卷上的文字,但卷軸碳化嚴重,無法輕易被打開閱讀。

  過去20年來,美國肯塔基大學EduceLab的西爾斯教授(Brent Seales)團隊使用X光技術和電腦技術,對該卷軸進行研究。2023年,「維蘇威挑戰」發起,為能夠從碳化卷軸中提取文字的研究人員提供獎勵,並成功吸引硅谷企業家Nat Friedman和Daniel Gross等人贊助。

  古卷探討快樂的來源

  2023年10月,「維蘇威挑戰」官網發布公告指,美國內布拉斯加大學林肯分校21歲電腦科學專業學生法里托和德國柏林自由大學的埃及研究生納德爾,利用自行開發的機器學習算法識別古希臘字母,在古卷的一個4平方厘米區域中,成功提取出了古希臘單詞「πορφúραc」,即「紫色」。

  此次研究成果,讓法里托成為兩千年來,第一個從未打開的卷軸中看到完整單詞的人,他也因此獲得40000美元(約31.3萬港元)的「首字母獎」獎金。比賽發起人之一Nat Friedman則在社交網站X表示,是次成果是研究中的重大突破,使「西爾斯教授和EduceLab團隊20年來工作成果終能實現」。

  本月5日,「維蘇威挑戰」公布了去年的獲獎結果,法里托、納德爾以及瑞士蘇黎世聯邦理工學院機器人學的學生席利格組成的團隊,通過機器學習算法,成功破解了卷軸上超過2000個希臘字母,獲得了70萬美元的大獎。獲獎作品展示了15列文本中的數百個單詞,相當於卷軸5%左右的內容量。文本內容探討了快樂的來源,包括音樂、刺山柑的味道和紫色。該獎項的評審之一、英國布里斯托爾大學的古典學家福勒將其稱為「一個歷史性的時刻」。

  精簡算法避免「AI幻覺」

  據報道,由於機器學習模型可能出現「AI幻覺」,在破譯卷軸時可能會「編造」看起來與訓練資料相似的文字或圖片,影響準確性。為此,研究人員採取了多種方法以減少AI犯錯的可能性。

  其中一種方法是縮小AI模型輸入和輸出值的範圍:AI墨水偵測模型並不基於希臘字母、光學字元辨識或語言模型,也不會直接識別出卷軸上的文字,相反,它們只需獨立地檢測CT掃描中的微小墨點,並輸出「有墨點」或「無墨點」的結果。當墨點聚集在一起後,就會拼湊出文字。因此,AI識別出的文字並不是機器學習模型「想像」出來的,而是直接與CT掃描中的基礎資料相關聯,大大減少了出現「AI幻覺」的幾率。

  今年目標破解90%內容

  這項成就震動了古代研究領域。美國加州洛杉磯J·保羅·蓋蒂博物館的古物館長拉帕廷表示,這簡直是「白日夢成真」。他說,本次對古卷的成功破譯,意味着研究人員先前因種種原因放棄破譯的數百卷卷軸,將有可能借新技術一同重見天日。赫庫蘭尼姆古卷中可能記載着更多希臘哲學的內容,其他一些用拉丁文撰寫的卷軸則涵蓋了更廣泛的主題領域。通過破譯這些卷軸,人們或將有機會找回荷馬、薩福等作家已失傳的詩歌和文學。

  「維蘇威挑戰」將於今年繼續進行,下一步的目標是破解整張卷軸。弗里德曼已經宣布了今年該挑戰的一系列新獎項,劍指在年底前閱讀90%的卷軸內容。但他同時也表示,能走到目前這一步「感覺就像是個奇跡」。