3 个月前

MM-DFN:面向对话情感识别的多模态动态融合网络

MM-DFN:面向对话情感识别的多模态动态融合网络

摘要

对话中的情感识别(Emotion Recognition in Conversations, ERC)在构建共情机器方面具有广阔的应用前景。对于多模态ERC而言,深入理解对话上下文并有效融合多模态信息至关重要。近年来,基于图结构的融合方法通常通过探索图中单模态与跨模态之间的交互关系来聚合多模态信息。然而,这类方法在每一层中容易累积冗余信息,限制了模态间上下文理解的深度与准确性。为此,本文提出一种新颖的多模态动态融合网络(Multimodal Dynamic Fusion Network, MM-DFN),旨在通过充分理解多模态对话上下文实现更精准的情感识别。具体而言,我们设计了一种基于图结构的动态融合模块,用于在对话中融合多模态上下文特征。该模块通过捕捉不同语义空间中上下文信息的动态变化,有效降低模态间的冗余性,增强模态间的互补性。在两个公开基准数据集上的大量实验结果表明,MM-DFN在性能上显著优于现有方法,验证了其有效性与优越性。

代码仓库

zerohd4869/mm-dfn
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
emotion-recognition-in-conversation-onMM-DFN
Accuracy: 68.21
Weighted-F1: 68.18
emotion-recognition-in-conversation-on-7MM-DFN
Accuracy: 80.91
Weighted F1: 80.83
emotion-recognition-in-conversation-on-cmu-2MM-DFN
Accuracy: 45.29
Weighted F1: 42.98
emotion-recognition-in-conversation-on-meldMM-DFN
Accuracy: 62.49
Weighted-F1: 59.46

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
MM-DFN:面向对话情感识别的多模态动态融合网络 | 论文 | HyperAI超神经