
摘要
本文概述了SemEval-2022中Task 4的相关工作,该任务聚焦于识别针对弱势群体的居高临下式与轻蔑式语言(Patronizing and Condescending Language, PCL)。任务包含两个子任务:一是二分类任务,要求参赛者判断给定段落是否包含PCL;二是多标签分类任务,要求参赛者识别出所存在的PCL类型(如存在)。该任务吸引了超过300名参与者,来自77支队伍,共提交了229份有效结果。本文介绍了任务的组织方式,分析了各参赛团队所采用的技术方法,并总结了在PCL检测与分类方面所获得的主要研究洞察。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| binary-condescension-detection-on-dpm | RoBERTa Baseline | F1-score: 49.1 |
| multi-label-condescension-detection-on-dpm | RoBERTa Baseline | Macro-F1: 10.4 |
| semeval-2022-task-4-1-binary-pcl-detection-on | RoBERTa Baseline | F1-score: 49.1 |
| semeval-2022-task-4-2-multi-label-pcl | RoBERTa Baseline | Macro-F1: 10.4 |