
摘要
伪相关反馈(Pseudo-relevance feedback, PRF)是一种常用的方法,通过利用排名靠前的文档来识别和加权新的查询词项,从而减少查询-文档词汇不匹配的影响,以提升传统信息检索(Information Retrieval, IR)模型的性能。尽管神经检索模型在最近的即席检索(ad-hoc retrieval)中展示了强大的结果,但将其与PRF结合并不直接,因为现有的PRF方法与神经网络架构之间存在不兼容性。为了弥合这一差距,我们提出了一种端到端的神经PRF框架,该框架可以通过嵌入不同的神经模型作为构建模块来与现有的神经IR模型结合使用。广泛的实验在两个标准测试集合上验证了所提出的NPRF框架在提高两种最先进的神经IR模型性能方面的有效性。
代码仓库
ucasir/NPRF
官方
tf
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| ad-hoc-information-retrieval-on-trec-robust04 | KNRM | MAP: 0.2464 P@20: 0.3510 nDCG@20: 0.3989 |
| ad-hoc-information-retrieval-on-trec-robust04 | NPRF-KNRM | MAP: 0.2846 P@20: 0.3926 nDCG@20: 0.4327 |
| ad-hoc-information-retrieval-on-trec-robust04 | NPRF-DRMM | MAP: 0.2904 P@20: 0.4064 nDCG@20: 0.4502 |