
摘要
本文介绍了我们为SemEval-2023第12项任务设计的系统:非洲语言的情感分析。该任务面临的挑战是在低资源环境下缺乏标注数据和语言资源。为了缓解这些问题,我们提出了一种通用的多语言系统SACL-XLMR,用于低资源语言的情感分析。具体而言,我们设计了一种基于词典的多语言BERT模型,以促进语言适应和情感感知表示学习。此外,我们应用了监督对抗对比学习技术来学习情感传播结构化的表示,并增强模型的泛化能力。我们的系统在多语言和零样本情感分类子任务中取得了具有竞争力的结果,显著优于基线模型。特别是在官方排名中,该系统在零样本分类子任务中获得了第一名。大量实验验证了我们系统的有效性。
代码仓库
zerohd4869/sacl
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| zero-shot-sentiment-classification-on | Random | weighted-F1 score: 0.34 |
| zero-shot-sentiment-classification-on | XLM-R | weighted-F1 score: 0.399 |
| zero-shot-sentiment-classification-on | AfriBERTa | weighted-F1 score: 0.439 |
| zero-shot-sentiment-classification-on | SACL-XLMR | weighted-F1 score: 0.589 |
| zero-shot-sentiment-classification-on | AfroXLMR | weighted-F1 score: 0.561 |