8 个月前

检索增强生成

自然语言处理

Hayate Iso†∗ Chao Qiao‡ Hang Li‡

摘要

我们提出了一种新的文本编辑任务，称为\textit{基于事实的文本编辑}，其目标是修订给定文档，以更好地描述知识库中的事实（例如，多个三元组）。该任务在实践中具有重要意义，因为反映真相是文本编辑的常见要求。首先，我们提出了一种自动生成基于事实的文本编辑研究数据集的方法，其中每个实例包括一篇草稿文本、一篇修订后的文本以及若干个以三元组形式表示的事实。我们将该方法应用于两个公开的表格到文本的数据集上，分别获得了包含23.3万和3.7万个实例的新数据集。接下来，我们提出了一种新的神经网络架构用于基于事实的文本编辑，称为\textsc{FactEditor}。该模型通过使用缓冲区、流和内存来引用给定的事实对草稿文本进行编辑。解决这一问题的一种直接方法是采用编码器-解码器模型。我们在两个数据集上的实验结果表明，\textsc{FactEditor}在忠实度和流畅性方面优于编码器-解码器方法。实验结果还显示，\textsc{FactEditor}在推理速度上也快于编码器-解码器方法。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

8 个月前

检索增强生成

自然语言处理

Hayate Iso†∗ Chao Qiao‡ Hang Li‡

摘要

我们提出了一种新的文本编辑任务，称为\textit{基于事实的文本编辑}，其目标是修订给定文档，以更好地描述知识库中的事实（例如，多个三元组）。该任务在实践中具有重要意义，因为反映真相是文本编辑的常见要求。首先，我们提出了一种自动生成基于事实的文本编辑研究数据集的方法，其中每个实例包括一篇草稿文本、一篇修订后的文本以及若干个以三元组形式表示的事实。我们将该方法应用于两个公开的表格到文本的数据集上，分别获得了包含23.3万和3.7万个实例的新数据集。接下来，我们提出了一种新的神经网络架构用于基于事实的文本编辑，称为\textsc{FactEditor}。该模型通过使用缓冲区、流和内存来引用给定的事实对草稿文本进行编辑。解决这一问题的一种直接方法是采用编码器-解码器模型。我们在两个数据集上的实验结果表明，\textsc{FactEditor}在忠实度和流畅性方面优于编码器-解码器方法。实验结果还显示，\textsc{FactEditor}在推理速度上也快于编码器-解码器方法。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供