
摘要
屈尊语言(Patronizing and Condescending Language, PCL)具有较大的负面影响,且难以被人类评审员和现有的自然语言处理(NLP)系统检测。在 SemEval-2022 第 4 项任务中,我们提出了一种基于 Transformer 的新型模型及其集成方法,以准确理解 PCL 的语境进行检测。为了帮助理解 PCL 细微且主观的特性,采用了两种微调策略来捕捉来自不同语言行为和类别分布的区分性特征。该系统在官方排名中取得了显著的成绩,包括子任务 1 中排名第 1 和子任务 2 中排名第 5。针对该任务的大量实验表明了我们系统的有效性和其策略的有效性。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| binary-condescension-detection-on-dpm | BERT-PCL | F1-score: 63.69 |
| multi-label-condescension-detection-on-dpm | BERT-PCL | Macro-F1: 43.28 |