3 个月前

基于句子级目标的预训练Transformer模型用于答案句子选择

基于句子级目标的预训练Transformer模型用于答案句子选择

摘要

设计问答系统的一项重要任务是答案句子选择(Answer Sentence Selection, AS2):从一组检索到的相关文档中,选出包含(或构成)问题答案的句子。本文提出三种新颖的基于句子级别的Transformer预训练目标,通过整合文档内及文档间的段落级语义信息,以提升Transformer模型在AS2任务上的性能,并降低对大规模标注数据集的依赖。具体而言,模型被要求预测以下三类任务:(i)两个句子是否来自同一段落;(ii)给定句子是否来自指定段落;(iii)两个段落是否来自同一文档。在三个公开数据集和一个工业级AS2数据集上的实验结果表明,所提出的预训练Transformer模型在AS2任务上显著优于RoBERTa、ELECTRA等基线模型,展现出优异的实证性能。

基准测试

基准方法指标
answer-selection-on-asnqELECTRA-Base + SSP
MAP: 0.697
MRR: 0.757
answer-selection-on-asnqDeBERTa-V3-Large + SSP
MAP: 0.743
MRR: 0.800
question-answering-on-trecqaDeBERTa-V3-Large + SSP
MAP: 0.923
MRR: 0.946
question-answering-on-trecqaRoBERTa-Base + PSD
MAP: 0.903
MRR: 0.951
question-answering-on-wikiqaDeBERTa-Large + SSP
MAP: 0.901
MRR: 0.914
question-answering-on-wikiqaRoBERTa-Base + SSP
MAP: 0.887
MRR: 0.899
question-answering-on-wikiqaDeBERTa-V3-Large + ALL
MAP: 0.909
MRR: 0.920

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于句子级目标的预训练Transformer模型用于答案句子选择 | 论文 | HyperAI超神经