
摘要
本文介绍了两个深度学习系统,它们参加了SemEval-2017任务4“推特情感分析”(Sentiment Analysis in Twitter)的竞赛。我们在所有英语推文子任务中均有参与,涵盖消息级情感极性分类与量化,以及基于话题的情感极性分析。我们的方法基于在大规模推文语料上预训练的词嵌入(word embeddings),并在此基础上采用长短期记忆网络(LSTM)结构,辅以两种不同的注意力机制(attention mechanisms)。此外,我们提出了一种适用于社交网络文本的文本处理工具,能够实现分词(tokenization)、词汇规范化(word normalization)、分段(segmentation)以及拼写纠正(spell correction)等功能。值得注意的是,我们的方法不依赖任何手工设计的特征或情感词典。在子任务A(Subtask A)中,我们取得了第一名(并列)的成绩,在其余子任务中也取得了极具竞争力的结果。本文所使用的词嵌入模型及文本处理工具均已向研究社区公开。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| sentiment-analysis-on-semeval-2017-task-4-a | DataStories | Average Recall: 0.681 |