3 个月前

DH-FBK 参与 SemEval-2022 任务 4:利用标注者分歧与多数据视角进行奉承语言检测

DH-FBK 参与 SemEval-2022 任务 4:利用标注者分歧与多数据视角进行奉承语言检测

摘要

在面向大众的媒体内容中,微妙且通常无意识使用的居高临下、轻蔑贬低的语言(Patronizing and Condescending Language, PCL)会不恰当地强化刻板印象,巩固权力—知识关系,从而持续加剧对弱势群体的歧视。由于PCL具有高度主观性和隐蔽性,其检测对计算方法和人工标注者而言均是一项开放且极具挑战性的任务。本文介绍了DH-FBK团队在SemEval-2022任务4中的参赛系统,该任务旨在识别英文媒体文本中针对弱势群体的PCL。受人类判断主观性启发,我们提出利用标注者之间的不确定性和分歧,在多任务、多视角学习框架下更精准地捕捉PCL的细微差异。所提出的方法取得了具有竞争力的性能表现,在PCL识别与分类两个子任务上均显著优于基线模型,并在排行榜上位居左上区域。值得注意的是,该方法无需依赖任何外部数据或模型集成,因而具备良好的实用性与可部署性,为现实场景中的PCL检测提供了一种可行且具吸引力的解决方案。

基准测试

基准方法指标
binary-condescension-detection-on-dpmMTMW (UNC+SPAN)
F1-score: 57.89
multi-label-condescension-detection-on-dpmMTMW (AGR+COU+SPAN)
Macro-F1: 37.35

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
DH-FBK 参与 SemEval-2022 任务 4:利用标注者分歧与多数据视角进行奉承语言检测 | 论文 | HyperAI超神经