3 个月前

基于模式驱动提示的语言模型对话状态追踪

基于模式驱动提示的语言模型对话状态追踪

摘要

面向任务的对话系统通常采用对话状态追踪(Dialogue State Tracking, DST)来表征用户的意图,该过程涉及填充预定义槽位(slot)的取值。尽管已有诸多方法被提出,但多数方法依赖于针对特定任务设计的架构以及专用分类器。近年来,基于预训练语言模型的通用架构在该任务上取得了优异成果。本文提出一种语言建模方法的新变体,通过基于模式(schema)的提示(prompting)机制,实现对任务感知的对话历史编码,该编码可同时适用于类别型与非类别型槽位。为进一步提升性能,我们还引入了模式描述(schema descriptions)作为提示的补充,这些描述源自领域内自然存在的知识,有助于增强模型对任务上下文的理解。所提出的完全生成式系统在MultiWOZ 2.2基准上达到当前最优性能,并在另外两个基准(MultiWOZ 2.1和M2M)上也展现出具有竞争力的表现。相关数据与代码将公开发布于 https://github.com/chiahsuan156/DST-as-Prompting。

代码仓库

基准测试

基准方法指标
dialogue-state-tracking-on-multiwoz-2-1SGP-DST (small)
MultiWOZ (Joint Goal Acc): 56.12
dialogue-state-tracking-on-multiwoz-2-1SGP-DST (base)
MultiWOZ (Joint Goal Acc): 56.66
dialogue-state-tracking-on-multiwoz-2-2SGP-DST (small)
MultiWOZ (Joint Goal Acc): 56.3
dialogue-state-tracking-on-multiwoz-2-2SGP-DST (base)
MultiWOZ (Joint Goal Acc): 57.6

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于模式驱动提示的语言模型对话状态追踪 | 论文 | HyperAI超神经