
摘要
文本中的数值推理是人工智能(AI)领域的一项具有挑战性的任务,要求具备阅读理解与数值推理能力。以往的方法通常采用数值推理程序来表征推理过程,但大多数现有工作未能将运算符(operators)与操作数(operands)的生成过程进行分离,而这两者正是数值推理程序的关键组成部分,因而限制了其在复杂任务中生成推理程序的能力。本文提出了一种名为“基于自适应符号编译器的数值推理模型”(numEricaL reASoning with adapTive symbolIc Compiler,简称 ELASTIC)的新方法。该模型由 RoBERTa 作为编码器,并配备一个包含四个模块的编译器:推理管理器(Reasoning Manager)、运算符生成器(Operator Generator)、操作数生成器(Operands Generator)以及内存寄存器(Memory Register)。ELASTIC 在处理复杂推理任务时表现出较强的鲁棒性,且具备领域无关性,能够灵活扩展多种运算符,而无需关注其操作数的数量。实验结果表明,ELASTIC 在 FinQA 数据集上取得了 68.96 的执行准确率和 65.21 的程序准确率,在 MathQA 数据集上达到了 83.00 的程序准确率,显著优于此前的最先进模型。
代码仓库
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| math-word-problem-solving-on-mathqa | ELASTIC (RoBERTa-large) | Answer Accuracy: 83.00 |
| question-answering-on-finqa | ELASTIC (RoBERTa-large) | Execution Accuracy: 68.96 Program Accuracy: 65.21 |