4 个月前

Doc2Graph:一种基于图神经网络的任务无关文档理解框架

Doc2Graph:一种基于图神经网络的任务无关文档理解框架

摘要

几何深度学习最近在包括文档分析在内的多个机器学习领域引起了广泛关注。图神经网络(GNNs)由于能够揭示关键信息提取过程中至关重要的结构模式,已成为各种文档相关任务中的关键技术。然而,以往文献中提出的工作主要集中在任务驱动模型上,未能充分利用图的全部潜力。本文提出了一种基于图神经网络模型的任务无关文档理解框架——Doc2Graph,旨在解决不同类型文档的不同任务。我们在两个具有挑战性的数据集上评估了该方法,这些数据集涉及表单理解的关键信息提取、发票布局分析和表格检测。我们的代码已免费发布在 https://github.com/andreagemelli/doc2graph 上。

代码仓库

andreagemelli/doc2graph
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
entity-linking-on-funsdDoc2Graph
F1: 53.36
semantic-entity-labeling-on-funsdDoc2Graph
F1: 82.25

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
Doc2Graph:一种基于图神经网络的任务无关文档理解框架 | 论文 | HyperAI超神经