6 个月前

多任务学习

自然语言处理

Jinhyuk Lee Mujeen Sung Jaewoo Kang Danqi Chen

摘要

开放域问答任务可被重新表述为一个短语检索问题，从而在推理阶段无需实时处理文档（Seo 等，2019）。然而，当前的短语检索模型严重依赖稀疏表示，性能仍落后于检索-阅读联合模型。在本工作中，我们首次证明，仅通过学习短语的稠密表示，即可在开放域问答任务中实现显著更强的性能。我们提出了一种有效方法，利用阅读理解任务的监督信号来学习短语表示，并结合新颖的负采样策略。此外，我们还引入了一种查询端微调策略，能够支持迁移学习，并有效缓解训练与推理阶段之间的分布差异。在五个主流的开放域问答数据集上，我们的模型 DensePhrases 相较于以往的短语检索模型，绝对准确率提升了 15%–25%，并达到了当前最优检索-阅读模型的性能水平。由于采用纯稠密表示，DensePhrases 模型具有良好的并行化能力，在 CPU 上每秒可处理超过 10 个问题。最后，我们直接将预索引的稠密短语表示应用于两个槽位填充任务，验证了 DensePhrases 作为下游任务稠密知识库的潜力。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

多任务学习

自然语言处理

Jinhyuk Lee Mujeen Sung Jaewoo Kang Danqi Chen

摘要

开放域问答任务可被重新表述为一个短语检索问题，从而在推理阶段无需实时处理文档（Seo 等，2019）。然而，当前的短语检索模型严重依赖稀疏表示，性能仍落后于检索-阅读联合模型。在本工作中，我们首次证明，仅通过学习短语的稠密表示，即可在开放域问答任务中实现显著更强的性能。我们提出了一种有效方法，利用阅读理解任务的监督信号来学习短语表示，并结合新颖的负采样策略。此外，我们还引入了一种查询端微调策略，能够支持迁移学习，并有效缓解训练与推理阶段之间的分布差异。在五个主流的开放域问答数据集上，我们的模型 DensePhrases 相较于以往的短语检索模型，绝对准确率提升了 15%–25%，并达到了当前最优检索-阅读模型的性能水平。由于采用纯稠密表示，DensePhrases 模型具有良好的并行化能力，在 CPU 上每秒可处理超过 10 个问题。最后，我们直接将预索引的稠密短语表示应用于两个槽位填充任务，验证了 DensePhrases 作为下游任务稠密知识库的潜力。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供