
摘要
本文提出了一种新的方法,用于解决自然语言处理中的一个基本问题——句子级别的答案选择任务。首先,我们通过采用预训练的语言模型来计算输入文本的向量表示,并从大规模语料库中应用迁移学习,探讨了附加信息的效果。其次,我们通过提出一种新的潜在聚类方法来计算目标语料库内的附加信息,并将目标函数从列表式改为点对点式,从而增强了比较聚合模型。为了评估所提方法的性能,我们在WikiQA和TREC-QA数据集上进行了实验。实证结果表明,我们的方法在这两个数据集上均达到了最先进的性能。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| question-answering-on-trecqa | Comp-Clip + LM + LC | MAP: 0.868 MRR: 0.928 |
| question-answering-on-wikiqa | Comp-Clip + LM + LC | MAP: 0.764 MRR: 0.784 |