4 个月前

基于语法的手写数学表达式识别网络

基于语法的手写数学表达式识别网络

摘要

手写数学表达式识别(HMER)是一项具有许多潜在应用的挑战性任务。近年来,基于编码器-解码器架构的方法在HMER中取得了卓越的性能。然而,这些方法遵循“从一个字符到另一个字符”的预测范式,这不可避免地会由于数学表达式的复杂结构或潦草的手写而导致预测错误。本文提出了一种简单且高效的手写数学表达式识别方法,首次将语法信息融入编码器-解码器网络中。具体而言,我们为每个表达式的LaTeX标记序列定义了一组语法规则,将其转换为解析树;然后,我们将标记序列的预测建模为使用深度神经网络进行的树遍历过程。通过这种方式,所提出的方法能够有效地描述表达式的语法上下文,从而减轻HMER中的结构预测错误。在三个基准数据集上的实验表明,我们的方法比现有技术实现了更好的识别性能。为了进一步验证我们方法的有效性,我们创建了一个大规模数据集,包含从一万名作者处收集的10万张手写数学表达式图像。本工作的源代码、新数据集和预训练模型将公开发布。

代码仓库

tal-tech/san
官方
pytorch
GitHub 中提及

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于语法的手写数学表达式识别网络 | 论文 | HyperAI超神经