8 个月前

统一多模态

多任务学习

Siqi Bao* Bingjin Chen* Huang He* Xin Tian* Han Zhou* Fan Wang Hua Wu Haifeng Wang Wenquan Wu Yingzhan Lin

摘要

在这项工作中，我们探讨了PLATO-2在各种对话系统中的应用，包括开放域对话、基于知识的对话以及任务导向型对话。PLATO-2最初被设计为一个开放域聊天机器人，通过两阶段课程学习进行训练。在第一阶段，学习了一个粗粒度的响应生成模型，以适应简化的一对一映射关系。鉴于任务完成过程中语义映射往往具有确定性，该模型被应用于任务导向型对话中。在第二阶段，进一步学习了另一个细粒度的生成模型和一个评估模型，分别用于多样化的响应生成和连贯性估计。这些模型由于具备捕捉一对多映射的强大能力，因此适用于开放域对话和基于知识的对话。为了全面评估PLATO-2，我们参与了DSTC9（第九届对话系统技术挑战赛）的多个任务，包括开放域对话的交互式评估（第三赛道-第二任务）、基于知识的对话的静态评估（第三赛道-第一任务）以及端到端的任务导向型对话（第二赛道-第一任务）。PLATO-2在这三项任务中均获得了第一名的成绩，验证了其作为各种对话系统的统一框架的有效性。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

8 个月前

统一多模态

多任务学习

Siqi Bao* Bingjin Chen* Huang He* Xin Tian* Han Zhou* Fan Wang Hua Wu Haifeng Wang Wenquan Wu Yingzhan Lin

摘要

在这项工作中，我们探讨了PLATO-2在各种对话系统中的应用，包括开放域对话、基于知识的对话以及任务导向型对话。PLATO-2最初被设计为一个开放域聊天机器人，通过两阶段课程学习进行训练。在第一阶段，学习了一个粗粒度的响应生成模型，以适应简化的一对一映射关系。鉴于任务完成过程中语义映射往往具有确定性，该模型被应用于任务导向型对话中。在第二阶段，进一步学习了另一个细粒度的生成模型和一个评估模型，分别用于多样化的响应生成和连贯性估计。这些模型由于具备捕捉一对多映射的强大能力，因此适用于开放域对话和基于知识的对话。为了全面评估PLATO-2，我们参与了DSTC9（第九届对话系统技术挑战赛）的多个任务，包括开放域对话的交互式评估（第三赛道-第二任务）、基于知识的对话的静态评估（第三赛道-第一任务）以及端到端的任务导向型对话（第二赛道-第一任务）。PLATO-2在这三项任务中均获得了第一名的成绩，验证了其作为各种对话系统的统一框架的有效性。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

对话人工智能的统一预训练框架 | 论文 | HyperAI超神经