4 个月前

ImageNet 预训练在历史文档图像分析中的全面研究

ImageNet 预训练在历史文档图像分析中的全面研究

摘要

自动分析扫描的历史文档涉及广泛的图像分析任务,这些任务由于缺乏人工标注的学习样本而对机器学习构成了挑战。随着深度神经网络的发展,一种应对训练数据不足的有前景的方法是在不同领域的图像上预训练模型,然后在历史文档上进行微调。当前研究中,跨域迁移学习的一个典型例子是使用在ImageNet数据库上预训练的神经网络进行物体识别。然而,关于这种预训练是否有助于分析具有根本不同图像属性的历史文档,仍是一个 largely open(大部分未解决)的问题。本文中,我们对ImageNet预训练在多种历史文档分析任务中的效果进行了全面的实证调查,包括字符识别、风格分类、手稿年代测定、语义分割和基于内容的检索。尽管我们在像素级语义分割方面获得了混合结果,但在不同的网络架构中观察到一个明显的趋势:ImageNet预训练对分类和基于内容的检索具有积极影响。

基准测试

基准方法指标
image-classification-on-kuzushiji-mnistResnet-152
Accuracy: 98.79

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
ImageNet 预训练在历史文档图像分析中的全面研究 | 论文 | HyperAI超神经