3 个月前

MAFiD:面向表格与文本数据问答的具备移动平均融合机制的解码器融合方法

MAFiD:面向表格与文本数据问答的具备移动平均融合机制的解码器融合方法

摘要

基于Transformer的问答模型在处理表格与文本的混合数据时,面临由表格元素与文本元素共同构成的“长”混合序列,由此引发长距离推理难题。为有效应对长距离推理问题,本文广泛采用解码器内融合(Fusion-in-Decoder, FiD)架构与指数移动平均(Exponential Moving Average, EMA)机制,提出一种名为MAFiD(Moving Average Equipped Fusion-in-Decoder)的新模型。以FiD作为骨干架构,MAFiD实现了多层次的推理能力:包括同质数据的独立编码、单行异质推理以及多行异质推理。通过引入门控交叉注意力层(gated cross attention layer),模型能够高效聚合上述三种不同推理路径所产生的表示。在HybridQA数据集上的实验结果表明,MAFiD在盲测集上分别将精确匹配(EM)和F1分数提升了1.1和1.7,达到了当前最优性能,显著推动了该任务的进展。

基准测试

基准方法指标
question-answering-on-hybridqaMAFiD
ANS-EM: 65.4

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
MAFiD:面向表格与文本数据问答的具备移动平均融合机制的解码器融合方法 | 论文 | HyperAI超神经