3 个月前

基于门控全卷积网络的无约束手写文本无复发识别

基于门控全卷积网络的无约束手写文本无复发识别

摘要

无约束手写文本识别是大多数文档分析任务中的关键步骤。传统方法通常采用深度循环神经网络,尤其是基于长短期记忆(Long Short-Term Memory, LSTM)单元的结构。然而,这类模型的主要局限在于参数量庞大,且在训练与推理过程中必须顺序执行,难以充分发挥并行计算的优势。作为一种替代方案,可通过大量使用卷积层来弥补长期记忆缺失的问题,因为卷积操作具有高度并行性,且参数量相对较少。本文提出一种门控全卷积网络(Gated Fully Convolutional Network)架构,作为对经典的CNN+LSTM结构的无循环替代方案。该模型采用连接时序分类(CTC)损失函数进行训练,在RIMES与IAM两个标准数据集上均取得了具有竞争力的识别性能。为便于实验复现,我们已公开全部代码:https://github.com/FactoDeepLearning/LinePytorchOCR。

代码仓库

基准测试

基准方法指标
handwritten-text-recognition-on-iam-lineGFCN
Test CER: 8.0
Test WER: 28.6
handwritten-text-recognition-on-lam-lineGFCN
Test CER: 5.2
Test WER: 18.5

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于门控全卷积网络的无约束手写文本无复发识别 | 论文 | HyperAI超神经