3 个月前

CDeC-Net:用于文档图像中表格检测的复合可变形级联网络

CDeC-Net:用于文档图像中表格检测的复合可变形级联网络

摘要

定位文档图像中的页面元素(如表格、图表、公式等)是信息提取的关键第一步。本文提出一种新型端到端可训练的深度神经网络——CDeC-Net,用于检测文档图像中的表格。该网络基于Mask R-CNN的多阶段扩展结构,采用双主干网络设计,并引入可变形卷积,能够高效检测不同尺度的表格,在较高的交并比(IoU)阈值下仍保持优异的检测精度。我们在所有公开可用的基准数据集上对CDeC-Net进行了全面的实证评估,包括ICDAR-2013、ICDAR-2017、ICDAR-2019、UNLV、Marmot、PubLayNet和TableBank,并开展了大量实验验证。本方法具有三个重要特性:(i)仅需一个训练好的模型CDeC-Net‡,即可在所有主流基准数据集上表现良好;(ii)在多个IoU阈值(包括更高的阈值)下均展现出卓越的检测性能;(iii)在每个基准数据集上均遵循近期相关研究的统一评估协议,持续展现出优越的定量性能。我们将在项目发布中公开代码与模型,以保障实验结果的可复现性。

代码仓库

samarthramesh/CDeC-Net
pytorch
GitHub 中提及
mdv3101/CDeCNet
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
document-layout-analysis-on-publaynet-valCDeC-Net
Table: 0.978
table-detection-on-icdar2013-1CDeCNet
Avg F1: 1.0

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
CDeC-Net:用于文档图像中表格检测的复合可变形级联网络 | 论文 | HyperAI超神经