8 个月前

检索增强生成

监督式微调

自然语言处理

Michael Glass; Gaetano Rossiello; Md Faisal Mahbub Chowdhury; Alfio Gliozzo

摘要

从给定的文档集合中自动诱导高质量的知识图谱仍然是人工智能领域的一个具有挑战性的问题。解决这一问题的一种方法是通过在相关任务——槽填充（slot filling）上的进展来实现。在这个任务中，系统被要求根据形式为[实体, 槽位, ?]的查询，利用从给定文档集合的相关段落中提取的证据生成或抽取缺失值以填充槽位。近期的研究尝试以端到端的方式使用基于检索的语言模型来解决这一任务。本文提出了一种新颖的零样本槽填充方法，该方法扩展了密集段落检索技术，引入了困难负例和稳健的训练流程，适用于检索增强生成模型。我们的模型在T-REx和zsRE槽填充数据集上取得了显著改进，不仅提升了段落检索性能，还提高了槽位值生成的质量，并在KILT排行榜上位居榜首。此外，我们展示了系统的鲁棒性及其在新变体TACRED数据集上的领域适应能力，这是通过结合零样本/少样本学习实现的。我们发布了源代码和预训练模型。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

8 个月前

检索增强生成

监督式微调

自然语言处理

Michael Glass; Gaetano Rossiello; Md Faisal Mahbub Chowdhury; Alfio Gliozzo

摘要

从给定的文档集合中自动诱导高质量的知识图谱仍然是人工智能领域的一个具有挑战性的问题。解决这一问题的一种方法是通过在相关任务——槽填充（slot filling）上的进展来实现。在这个任务中，系统被要求根据形式为[实体, 槽位, ?]的查询，利用从给定文档集合的相关段落中提取的证据生成或抽取缺失值以填充槽位。近期的研究尝试以端到端的方式使用基于检索的语言模型来解决这一任务。本文提出了一种新颖的零样本槽填充方法，该方法扩展了密集段落检索技术，引入了困难负例和稳健的训练流程，适用于检索增强生成模型。我们的模型在T-REx和zsRE槽填充数据集上取得了显著改进，不仅提升了段落检索性能，还提高了槽位值生成的质量，并在KILT排行榜上位居榜首。此外，我们展示了系统的鲁棒性及其在新变体TACRED数据集上的领域适应能力，这是通过结合零样本/少样本学习实现的。我们发布了源代码和预训练模型。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供