4 个月前

利用数百万表情符号出现次数学习任意领域的表示以检测情感、情绪和讽刺

利用数百万表情符号出现次数学习任意领域的表示以检测情感、情绪和讽刺

摘要

自然语言处理(NLP)任务经常受到手动标注数据稀缺性的限制。在社交媒体情感分析及相关任务中,研究人员因此使用了二值化表情符号和特定的标签(hashtag)作为远距离监督的形式。本文表明,通过将远距离监督扩展到更多样化的噪声标签集,模型可以学习到更丰富的表示。我们通过对包含64种常用表情符号之一的12.46亿条推文进行表情预测,使用单一预训练模型,在8个基准数据集上实现了情感、情绪和讽刺检测方面的最先进性能。我们的分析证实,我们的情感标签的多样性相较于先前的远距离监督方法带来了性能提升。

代码仓库

alexandra-chron/wassa-2018
pytorch
GitHub 中提及
SEntiMoji/SEntiMoji
tf
GitHub 中提及
bfelbo/deepmoji
官方
tf
GitHub 中提及
huggingface/torchMoji
pytorch
GitHub 中提及
Obs01ete/chatbot
pytorch
GitHub 中提及

基准测试

基准方法指标
sentiment-analysis-on-1b-wordsRandom
1 in 10 R@1: 17
sentiment-analysis-on-mrMillions of Emoji
Training Time: 1500

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
利用数百万表情符号出现次数学习任意领域的表示以检测情感、情绪和讽刺 | 论文 | HyperAI超神经