
摘要
答案句子选择是指识别包含给定问题答案的句子的任务。这不仅是一个重要的独立问题,也是开放域问答系统中的一个关键组成部分。我们提出了一种基于分布式表示的新方法来解决这一任务,并通过考虑问题和答案的语义编码来学习它们之间的匹配。这种方法与以往的工作形成对比,后者通常依赖于具有大量手工设计的句法和语义特征以及各种外部资源的分类器。我们的方法不需要任何特征工程,也不涉及专门的语言数据,从而使该模型能够轻松应用于广泛的领域和语言。在TREC提供的标准基准数据集上的实验结果表明,尽管该模型简单,但在答案句子选择任务上其性能达到了现有最佳水平。
代码仓库
brmson/dataset-sts
GitHub 中提及
umutguneri/Question-Answering-Assistant
tf
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| question-answering-on-qasent | Bigram-CNN | MAP: 0.5693 MRR: 0.6613 |
| question-answering-on-qasent | Bigram-CNN (lexical overlap + dist output) | MAP: 0.7113 MRR: 0.7846 |
| question-answering-on-trecqa | CNN | MAP: 0.711 MRR: 0.785 |
| question-answering-on-wikiqa | Bigram-CNN (lexical overlap + dist output) | MAP: 0.6520 MRR: 0.6652 |
| question-answering-on-wikiqa | Bigram-CNN | MAP: 0.6190 MRR: 0.6281 |