
摘要
本研究致力于生成式阅读理解(RC),该任务包括基于文本证据回答问题和自然语言生成(NLG)。我们提出了一种用于问答的多风格抽象摘要模型,称为Masque。所提出的模型具有两个关键特点。首先,与大多数集中在从给定段落中提取答案范围的RC研究不同,我们的模型侧重于从问题和多个段落中生成摘要。这有助于涵盖实际应用所需的多种答案风格。其次,由于难以构建一个通用模型来应对所有答案风格,以往的研究为每种风格构建了特定的模型;而我们的方法则在一个模型内学习多种风格的答案,以提高所有相关风格的NLG能力。这也使得我们的模型能够在目标风格下给出答案。实验结果表明,我们的模型在MS MARCO 2.1的问答任务和问答+自然语言生成任务以及NarrativeQA的摘要任务上均达到了最先进的性能。我们观察到,将风格独立的NLG能力迁移到目标风格是其成功的关键。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| question-answering-on-ms-marco | Masque Q&A Style | BLEU-1: 43.77 Rouge-L: 52.2 |
| question-answering-on-narrativeqa | Masque (NarrativeQA only) | BLEU-1: 48.7 BLEU-4: 20.98 METEOR: 21.95 Rouge-L: 54.74 |
| question-answering-on-narrativeqa | Masque (NarrativeQA + MS MARCO) | BLEU-1: 54.11 BLEU-4: 30.43 METEOR: 26.13 Rouge-L: 59.87 |