3 个月前

多变量、多频率与多模态:面向对话情感识别的图神经网络再思考

多变量、多频率与多模态:面向对话情感识别的图神经网络再思考

摘要

跨模态与上下文维度的高阶复杂关系是对话情感识别(Emotion Recognition in Conversation, ERC)任务中的关键挑战。然而,以往的研究多采用松散耦合的方式编码多模态与上下文关系,可能损害关系建模的准确性。近年来,图神经网络(Graph Neural Networks, GNN)因其在捕捉数据间关系方面的优势,为ERC任务提供了新的解决方案。然而,现有的基于GNN的ERC模型未能有效克服GNN的一些固有局限,例如假设关系仅限于成对形式,以及忽略高频信号,而这些在多数应用中可能看似次要,却对ERC任务至关重要。本文提出一种基于GNN的新型模型,通过挖掘多变量关系并利用多频信号来量化情感差异与共性的动态重要性,从而增强模型对话语间内在关系的捕捉能力,实现更充分的多模态与上下文建模。实验结果表明,所提出的方法在两个主流多模态ERC数据集上均优于现有最先进模型。

基准测试

基准方法指标
emotion-recognition-in-conversation-on-7M3Net
Accuracy: 83.67
Weighted F1: 83.57
emotion-recognition-in-conversation-on-cmu-2M3Net
Accuracy: 43.67
Weighted F1: 41.12

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
多变量、多频率与多模态:面向对话情感识别的图神经网络再思考 | 论文 | HyperAI超神经