4 个月前

粗粒度细粒度协同注意力网络用于多证据问答

粗粒度细粒度协同注意力网络用于多证据问答

摘要

端到端神经模型在问答领域取得了显著进展,然而最近的研究表明,这些模型隐含地假设答案和证据在单个文档中紧密相邻出现。在这项工作中,我们提出了一种新的问答模型——粗粒度细粒度共注意网络(Coarse-grain Fine-grain Coattention Network, CFC),该模型结合了多个文档中的证据信息。CFC 包括一个粗粒度模块,该模块根据查询解释文档并找到相关答案;以及一个细粒度模块,该模块通过比较每个候选答案在所有文档中的出现情况与查询来对候选答案进行评分。我们使用共注意和自注意的层次结构设计了这些模块,这些结构能够学习突出输入的不同部分。在 Qangaroo WikiHop 多证据问答任务中,CFC 在盲测集上获得了 70.6% 的新最先进结果,尽管没有使用预训练的上下文编码器,但其准确率仍比之前的最佳结果高出 3%。

基准测试

基准方法指标
question-answering-on-wikihopCFC
Test: 70.6

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
粗粒度细粒度协同注意力网络用于多证据问答 | 论文 | HyperAI超神经