4 个月前

基于图像的表格识别端到端多任务学习模型

基于图像的表格识别端到端多任务学习模型

摘要

基于图像的表格识别是一项具有挑战性的任务,原因在于表格样式的多样性和表格结构的复杂性。大多数先前的方法侧重于非端到端的方法,将问题分为两个独立的子问题:表格结构识别和单元格内容识别,然后分别使用两个独立的系统来解决每个子问题。本文提出了一种用于基于图像的表格识别的端到端多任务学习模型。该模型由一个共享编码器、一个共享解码器和三个独立的解码器组成,这三个解码器分别用于学习表格识别的三个子任务:表格结构识别、单元格检测和单元格内容识别。整个系统可以轻松地以端到端的方式进行训练和推理。在实验中,我们在两个大规模数据集上评估了所提模型的性能:FinTabNet 和 PubTabNet。实验结果表明,所提模型在所有基准数据集上的表现均优于现有最先进方法。

代码仓库

基准测试

基准方法指标
table-recognition-on-pubtabnetMulti-Task Learning Model
TEDS (all samples): 96.67
TEDS-Struct: 97.88

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于图像的表格识别端到端多任务学习模型 | 论文 | HyperAI超神经