
摘要
本文描述了我们尝试使用卷积神经网络(CNNs)和长短期记忆网络(LSTMs)构建最先进的Twitter情感分类器的过程。我们的系统利用大量未标注数据对词嵌入进行预训练。随后,我们使用未标注数据的一个子集,通过远监督方法对词嵌入进行微调。最终的CNNs和LSTMs在SemEval-2017 Twitter数据集上进行了训练,期间再次对词嵌入进行了微调。为了提高性能,我们将多个CNNs和LSTMs组合在一起。我们的方法在40个团队中,在所有五个英语子任务中均取得了第一名的成绩。
代码仓库
lopezbec/COVID19_Tweets_Dataset_2020
GitHub 中提及
leelaylay/TweetSemEval
pytorch
GitHub 中提及
lopezbec/COVID19_Tweets_Dataset
GitHub 中提及
nileshsah/deep-text-classifier
GitHub 中提及
kaliahinartem/twitter_sentiment_analysis
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| sentiment-analysis-on-semeval | LSTMs+CNNs ensemble with multiple conv. ops | F1-score: 0.685 |
| sentiment-analysis-on-semeval-2017-task-4-a | LSTMs+CNNs ensemble with multiple conv. ops | Average Recall: 0.681 |