3 个月前

使用深度神经网络恢复与溯源古籍文本

使用深度神经网络恢复与溯源古籍文本

摘要

古代历史研究依赖于诸如铭文学(epigraphy)等学科,即通过对铭文(inscriptions)——刻写在石碑、陶器等载体上的文字材料——的研究,来获取古代文明在思想、语言、社会结构及历史发展方面的证据。然而,历经数个世纪,许多铭文已严重损毁至难以辨识,或被移离其原始出土地点,其书写年代也充满不确定性。本文提出Ithaca,一种用于古希腊铭文文本修复、地理归属与年代判定的深度神经网络模型。Ithaca旨在辅助并拓展历史学家的研究流程,其架构设计聚焦于协作性、决策支持与可解释性。尽管Ithaca在独立执行铭文修复任务时准确率已达62%,但当历史学家结合使用Ithaca时,其准确率从原先的25%显著提升至72%,充分验证了该工具与人类研究者之间的协同增效作用。Ithaca在铭文原始出土地点归属判断上达到71%的准确率,并能将铭文年代精确至真实年代范围的30年以内,从而重新校准了古典雅典时期若干关键文献的年代,为古代史领域的核心议题提供了新的学术支持。本研究展示了类似Ithaca的智能模型如何激发人工智能与历史学家之间的深度协作潜能,从根本上革新我们研究与书写人类历史上最重要时期之一的方式。

基准测试

基准方法指标
ancient-text-restoration-on-i-phiIthaca
CER (%): 26.3
Date (Years): 29.3
Region (Top 1 (%)): 70.8
Region (Top 3 (%)): 82.1
Top 1 (%): 61.8
ancient-text-restoration-on-i-phiPythia
CER (%): 47.0
Top 1 (%): 32.6
Top 20 (%): 53.9
ancient-text-restoration-on-i-phiOnomastics
Date (Years): 144.4
Region (Top 1 (%)): 21.2
Region (Top 3 (%)): 26.5
ancient-text-restoration-on-i-phiAncient historian and Ithaca
CER (%): 18.3
Top 1 (%): 71.7
Top 20 (%): 78.3
ancient-text-restoration-on-i-phiAncient historian
CER (%): 59.6
Top 1 (%): 25.3

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
使用深度神经网络恢复与溯源古籍文本 | 论文 | HyperAI超神经