4 个月前

使用层次编码器和CRF进行对话行为序列标注

使用层次编码器和CRF进行对话行为序列标注

摘要

对话行为识别(Dialogue Act Recognition)将对话中的每个话语与其对应的对话行为(即语义标签)关联起来。将语义标签与话语关联的问题可以视为一个序列标注问题。在本研究中,我们构建了一个层次递归神经网络,以双向长短期记忆网络(Bidirectional LSTM)作为基础单元,条件随机场(Conditional Random Field, CRF)作为顶层来对每个话语进行分类,确定其相应的对话行为。该层次网络在多个层级上学习表示,包括词汇级、话语级和对话级。对话级别的表示被输入到CRF层,该层不仅考虑了所有先前的话语,还考虑了它们的对话行为,从而建模了标签和话语之间的依赖关系,这是自然对话中的一个重要考量因素。我们在两个不同的基准数据集上验证了我们的方法:Switchboard 和会议记录对话行为数据集(Meeting Recorder Dialogue Act),并分别在这些数据集上比现有最先进方法绝对提高了2.2%和4.1%的性能。值得注意的是,Switchboard 数据集的注释者间一致性为84%,而我们的方法尽管是在噪声数据上训练的,仍能达到约79%的准确率。

代码仓库

基准测试

基准方法指标
dialogue-act-classification-on-icsi-meetingBi-LSTM-CRF
Accuracy: 90.9
dialogue-act-classification-on-switchboardBi-LSTM-CRF
Accuracy: 79.2

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
使用层次编码器和CRF进行对话行为序列标注 | 论文 | HyperAI超神经