4 个月前

CascadeTabNet:一种用于图像文档中表格检测和结构识别的端到端方法

CascadeTabNet:一种用于图像文档中表格检测和结构识别的端到端方法

摘要

一种用于文档图像中表格数据解释的自动表格识别方法主要涉及解决两个问题:表格检测和表格结构识别。早期的研究工作通常分别使用两种独立的方法来解决这两个问题。而近期的研究则强调了基于深度学习的解决方案的应用,并尝试设计端到端的解决方案。本文提出了一种改进的基于深度学习的端到端方法,利用单一卷积神经网络(CNN)模型同时解决表格检测和结构识别的问题。我们提出了级联表网(CascadeTabNet):一种基于级联掩码区域卷积神经网络高分辨率网络(Cascade mask R-CNN HRNet)的模型,该模型能够同时检测表格区域并识别已检测表格中的结构单元格。我们在ICDAR 2013、ICDAR 2019和TableBank公共数据集上评估了我们的结果。在ICDAR 2019比赛后的结果中,我们的方法在表格检测方面获得了第三名,而在ICDAR 2013和TableBank数据集上达到了最佳的准确性结果。此外,我们在ICDAR 2019表格结构识别数据集上也取得了最高的准确性结果。我们还展示了有效的迁移学习和图像增强技术,这些技术使得卷积神经网络能够在表格检测任务中达到非常高的准确性。代码和数据集已发布在:https://github.com/DevashishPrasad/CascadeTabNet

代码仓库

hmnth1/table_ocr
pytorch
GitHub 中提及
DevashishPrasad/CascadeTabNet
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
table-detection-on-icdar2013-1cascadetabnet
Avg F1: 1.0

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
CascadeTabNet:一种用于图像文档中表格检测和结构识别的端到端方法 | 论文 | HyperAI超神经