6 个月前

自然语言处理

自然语言处理

Shubham Toshniwal Patrick Xia Sam Wiseman Karen Livescu Kevin Gimpel

摘要

尽管共指消解任务在定义上与数据集领域无关，但大多数现有的共指消解模型在未见领域上的泛化能力较差。为此，我们整合了8个针对不同领域的共指消解数据集，用于评估现有模型在“开箱即用”情况下的性能表现。随后，我们选取其中三个数据集进行联合训练；尽管这些数据集在领域、标注规范和元数据方面存在差异，我们提出一种方法，通过数据增强来应对标注差异，并结合采样策略平衡各类数据的样本数量，从而实现对异构数据混合体的联合训练。实验结果表明，在零样本（zero-shot）设置下，仅在单一数据集上训练的模型泛化性能较差，而联合训练显著提升了整体性能，从而增强了共指消解模型的泛化能力。本研究构建了一个新的基准数据集，用于评估鲁棒的共指消解模型，并取得了多项新的最先进（state-of-the-art）结果。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

自然语言处理

自然语言处理

Shubham Toshniwal Patrick Xia Sam Wiseman Karen Livescu Kevin Gimpel

摘要

尽管共指消解任务在定义上与数据集领域无关，但大多数现有的共指消解模型在未见领域上的泛化能力较差。为此，我们整合了8个针对不同领域的共指消解数据集，用于评估现有模型在“开箱即用”情况下的性能表现。随后，我们选取其中三个数据集进行联合训练；尽管这些数据集在领域、标注规范和元数据方面存在差异，我们提出一种方法，通过数据增强来应对标注差异，并结合采样策略平衡各类数据的样本数量，从而实现对异构数据混合体的联合训练。实验结果表明，在零样本（zero-shot）设置下，仅在单一数据集上训练的模型泛化性能较差，而联合训练显著提升了整体性能，从而增强了共指消解模型的泛化能力。本研究构建了一个新的基准数据集，用于评估鲁棒的共指消解模型，并取得了多项新的最先进（state-of-the-art）结果。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供