
摘要
让机器学会阅读自然语言文档仍然是一个难以攻克的挑战。虽然可以通过测试机器阅读系统回答有关其已读文档内容的问题的能力来评估这些系统,但迄今为止,大规模的训练和测试数据集在这一类型的评估中仍然缺失。在这项研究中,我们提出了一种新的方法论,解决了这一瓶颈问题,并提供了大规模的监督阅读理解数据。这使得我们能够开发一类基于注意力机制的深度神经网络,该网络能够在对语言结构仅有最少先验知识的情况下学习阅读真实文档并回答复杂问题。
代码仓库
google-deepmind/rc-data
GitHub 中提及
surekhamedapati/NLPA_NEO
pytorch
GitHub 中提及
chalothon/Cnn-Daily-mail
GitHub 中提及
facebookresearch/ParlAI
pytorch
GitHub 中提及
zhengcj1/ChID-Dataset
tf
GitHub 中提及
wujsAct/DeepLearningModels
tf
GitHub 中提及
chujiezheng/ChID-Dataset
tf
GitHub 中提及
joe-prog/https-github.com-facebookresearch-ParlAI
pytorch
GitHub 中提及
youngjie-cho/csci1470final
GitHub 中提及
deepmind/rc-data
官方
GitHub 中提及
orange-opensource/coqar
pytorch
GitHub 中提及
thinkwee/DPP_CNN_Summarization
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| question-answering-on-cnn-daily-mail | Impatient Reader | CNN: 63.8 Daily Mail: 68.0 |
| question-answering-on-cnn-daily-mail | Attentive Reader | CNN: 63 Daily Mail: 69 |
| question-answering-on-cnn-daily-mail | MemNNs (ensemble) | CNN: 69.4 |