3 个月前

来自众包标注的手写文本识别

来自众包标注的手写文本识别

摘要

本文探讨了在存在多个不完美或含噪声转录文本的情况下,训练手写文本识别模型的多种方法。我们考察了多种训练配置,包括选择单一转录文本、保留所有转录文本,以及基于所有可用标注计算一个聚合转录文本。此外,我们还评估了基于质量的数据筛选策略的影响,即从训练集中移除标注者之间一致性较低的样本。实验基于法国贝尔福市(Belfort)1790年至1946年间的城市登记档案进行。实验结果表明,采用共识转录文本或在多个转录文本上联合训练是有效的替代方案。然而,基于标注者之间一致程度来选择训练样本,会在训练数据中引入偏差,且未能提升模型性能。本研究使用的数据集已公开发布于Zenodo平台:https://zenodo.org/record/8041668。

基准测试

基准方法指标
handwritten-text-recognition-on-belfortPyLaia (human transcriptions + random split)
CER (%): 10.54
WER (%): 28.11
handwritten-text-recognition-on-belfortPyLaia (all transcriptions + agreement-based split)
CER (%): 4.34
WER (%): 15.14
handwritten-text-recognition-on-belfortPyLaia (human transcriptions + agreement-based split)
CER (%): 5.57
WER (%): 19.12
handwritten-text-recognition-on-belfortPyLaia (rover consensus + agreement-based split)
CER (%): 4.95
WER (%): 17.08

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
来自众包标注的手写文本识别 | 论文 | HyperAI超神经