4 个月前

门控注意力阅读器用于文本理解

门控注意力阅读器用于文本理解

摘要

本文研究了文档中回答完形填空式问题的问题。我们的模型,即门控注意力(Gated-Attention, GA)阅读器,将多跳架构与一种新颖的注意力机制相结合,该机制基于查询嵌入与递归神经网络文档阅读器中间状态之间的乘法交互。这使得阅读器能够构建文档中针对查询的特定表示,从而实现精确的答案选择。GA阅读器在三个基准测试集上取得了当前最佳的结果——CNN和Daily Mail新闻故事以及Who Did What数据集。通过消融研究和与其他用于实现门控注意力的组合运算符进行比较,证明了乘法交互的有效性。代码可在https://github.com/bdhingra/ga-reader 获取。

代码仓库

gchhablani/ReCAM
pytorch
GitHub 中提及
bdhingra/ga-reader
官方
GitHub 中提及
AI-metrics/AI-metrics
GitHub 中提及
aartika/experiment1
tf
GitHub 中提及

基准测试

基准方法指标
open-domain-question-answering-on-quasarGA
EM (Quasar-T): 26.4
F1 (Quasar-T): 26.4
question-answering-on-childrens-book-testGA reader
Accuracy-CN: 69.4%
Accuracy-NE: 71.9%
question-answering-on-childrens-book-testNSE
Accuracy-CN: 71.9%
Accuracy-NE: 73.2%
question-answering-on-childrens-book-testGA + feature + fix L(w)
Accuracy-CN: 70.7%
Accuracy-NE: 74.9%
question-answering-on-cnn-daily-mailGA Reader
CNN: 77.9
Daily Mail: 80.9

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
门控注意力阅读器用于文本理解 | 论文 | HyperAI超神经