3 个月前

基于Transformer的调制融合在语言-声学情感识别中的应用

基于Transformer的调制融合在语言-声学情感识别中的应用

摘要

本文旨在为情感识别与情感分析任务提供一种轻量化 yet 强大的新解决方案。我们的研究动机在于提出两种基于Transformer架构并融合调制机制的模型,能够整合来自多种数据集的语言与语音输入,以挑战甚至超越当前该领域的最先进水平。为充分验证所提模型的高效性,我们在IEMOCAP、MOSI、MOSEI和MELD等多个公开数据集上进行了细致的性能评估。实验结果可直接复现,相关代码已完全开源,以支持未来的研究工作。

代码仓库

基准测试

基准方法指标
multimodal-sentiment-analysis-on-cmu-mosei-1Modulated-fusion transformer
Accuracy: 82.45

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供