3 个月前

神经符号阅读器:面向阅读理解的分布式与符号化表示的可扩展融合

神经符号阅读器:面向阅读理解的分布式与符号化表示的可扩展融合

摘要

将分布式表示与符号操作相结合,对于需要复杂推理的阅读理解任务(如计数、排序和算术运算)至关重要。然而,现有大多数方法难以扩展到更多领域或更复杂的推理场景。在本工作中,我们提出了神经符号阅读器(Neural Symbolic Reader, NeRd),其包含一个阅读器(如BERT)用于编码文本段落和问题,以及一个程序生成器(如LSTM)用于生成可执行的程序,该程序最终生成答案。相较于以往方法,NeRd在两个方面展现出更强的可扩展性:(1)领域无关性,即相同的神经架构可适用于不同领域;(2)组合性,即在需要时,可通过递归调用预定义的操作符生成复杂程序,从而形成可执行且可解释的表示,支持更复杂的推理过程。此外,为应对在弱监督条件下训练NeRd的挑战,我们采用了数据增强技术,并结合带阈值的硬期望最大化(hard Expectation-Maximization, EM)算法。在DROP这一要求离散推理的挑战性阅读理解数据集上,NeRd在EM和F1指标上分别较当前最优方法实现了1.37%和1.18%的绝对提升。在MathQA——一个需要多步推理的数学问题基准测试中,使用相同架构的NeRd在全部标注程序训练下,准确率相比基线方法提升了25.5%的绝对值。更为重要的是,即使仅提供20%的程序标注数据,NeRd依然显著优于现有基线方法。

基准测试

基准方法指标
question-answering-on-drop-testNeRd
F1: 81.71

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
神经符号阅读器:面向阅读理解的分布式与符号化表示的可扩展融合 | 论文 | HyperAI超神经