3 个月前

SemEval-2017任务4中的DataStories:基于深度LSTM与注意力机制的消息级及基于主题的情感分析

SemEval-2017任务4中的DataStories:基于深度LSTM与注意力机制的消息级及基于主题的情感分析

摘要

本文介绍了两个深度学习系统,它们参加了SemEval-2017任务4“推特情感分析”(Sentiment Analysis in Twitter)的竞赛。我们在所有英语推文子任务中均有参与,涵盖消息级情感极性分类与量化,以及基于话题的情感极性分析。我们的方法基于在大规模推文语料上预训练的词嵌入(word embeddings),并在此基础上采用长短期记忆网络(LSTM)结构,辅以两种不同的注意力机制(attention mechanisms)。此外,我们提出了一种适用于社交网络文本的文本处理工具,能够实现分词(tokenization)、词汇规范化(word normalization)、分段(segmentation)以及拼写纠正(spell correction)等功能。值得注意的是,我们的方法不依赖任何手工设计的特征或情感词典。在子任务A(Subtask A)中,我们取得了第一名(并列)的成绩,在其余子任务中也取得了极具竞争力的结果。本文所使用的词嵌入模型及文本处理工具均已向研究社区公开。

基准测试

基准方法指标
sentiment-analysis-on-semeval-2017-task-4-aDataStories
Average Recall: 0.681

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
SemEval-2017任务4中的DataStories:基于深度LSTM与注意力机制的消息级及基于主题的情感分析 | 论文 | HyperAI超神经