
摘要
情感挖掘,也称为情感分析,是自然语言处理(NLP)的一个子领域,专注于识别和提取文本材料中的主观信息。这包括确定文本的整体情感倾向(例如,正面或负面),以及识别文本中表达的具体情绪或观点,涉及使用先进的机器学习和深度学习技术。近年来,基于变压器的语言模型使得人类情感分析任务更加直观,这得益于注意力机制和平行计算的优势。这些优势使得此类模型在语言任务上非常强大,而循环神经网络由于在顺序处理上花费大量时间,处理长文本时容易失败。本文的研究范围旨在探讨最前沿的基于变压器的语言模型在情感挖掘中的表现,并对它们进行高层次的比较以突出其关键特性。此外,我们的比较研究为生产工程师指明了方向,并为研究人员提供了未来研究课题的指导。
代码仓库
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| opinion-mining-on-imdb-movie-reviews | BERT | Accuracy: 94.0 F1: 94.1 |
| opinion-mining-on-imdb-movie-reviews | ConvBERT | Accuracy: 94.5 F1: 94.6 |
| opinion-mining-on-imdb-movie-reviews | GPT | Accuracy: 53.2 F1: 66.4 |
| opinion-mining-on-imdb-movie-reviews | T5 | Accuracy: 93.9 F1: 94.0 |
| opinion-mining-on-imdb-movie-reviews | XLNet | Accuracy: 94.8 F1: 94.9 |
| opinion-mining-on-imdb-movie-reviews | DeBERTa | Accuracy: 95.1 F1: 95.1 |
| opinion-mining-on-imdb-movie-reviews | XLM-RoBERTA | Accuracy: 75.2 F1: 77.0 |
| opinion-mining-on-imdb-movie-reviews | DistilBERT | Accuracy: 93.4 F1: 93.5 |
| opinion-mining-on-imdb-movie-reviews | ALBERT | Accuracy: 93.0 F1: 93.0 |
| opinion-mining-on-imdb-movie-reviews | GPT-2 | Accuracy: 54.5 F1: 52.9 |
| opinion-mining-on-imdb-movie-reviews | RoBERTa | Accuracy: 95.3 F1: 95.3 |
| opinion-mining-on-imdb-movie-reviews | Longformer | Accuracy: 95.0 |
| opinion-mining-on-imdb-movie-reviews | ELECTRA | Accuracy: 95.6 F1: 95.6 |
| opinion-mining-on-imdb-movie-reviews | BART | Accuracy: 94.6 |
| opinion-mining-on-imdb-movie-reviews | Reformer | Accuracy: 52.2 F1: 53.3 |