
摘要
基于方面的情感分析(Aspect-Based Sentiment Analysis, ABSA)是一项细粒度任务,旨在识别句子中特定方面词的情感极性。然而,ABSA任务的发展严重受限于标注数据的匮乏。为应对这一挑战,先前的研究尝试利用情感分析(Sentiment Analysis, SA)数据集辅助ABSA模型的训练,主要通过预训练或多任务学习的方式。本文延续这一研究思路,并首次将伪标签(Pseudo-Labeling, PL)方法应用于融合两个同质任务,实现标签粒度的统一。尽管将生成的伪标签用于解决两个高度相关任务之间的标签粒度不一致问题看似直接可行,本文仍识别出其中存在的主要挑战,并提出一种新颖的框架——双粒度伪标签(Dual-granularity Pseudo Labeling, DPL)。此外,与PL方法类似,DPL被设计为一种通用框架,能够与文献中其他已有方法进行集成。通过大量实验验证,DPL在标准基准测试上取得了当前最优的性能,显著超越了先前的工作。
代码仓库
yiming-zh/DPL
官方
pytorch
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| aspect-based-sentiment-analysis-on-semeval | DPL-BERT | Laptop (Acc): 81.96 Mean Acc (Restaurant + Laptop): 85.75 Restaurant (Acc): 89.54 |