3 个月前

标注在线性别歧视

标注在线性别歧视

摘要

网络性别歧视(online misogyny)作为一种网络暴力语言的类别,具有严重的社会危害性。对网络中的性别歧视语言进行自动检测虽属迫切需求,但在数据收集、数据标注以及偏见缓解等方面均面临复杂挑战,原因在于此类语言在语言特征上具有高度的复杂性与多样性。本文在该领域作出三项贡献:首先,详细阐述了我们迭代式标注流程与标注手册(codebook)的设计过程;其次,提出了一套全面的标签分类体系,用于对自然书面语言中的性别歧视内容进行标注;最后,构建了一个高质量的标注数据集,其中的文本样本均来自社交媒体帖子的抽样数据。

基准测试

基准方法指标
hate-speech-detection-on-bajer-danishAOM mBERT
F1: 0.8549

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
标注在线性别歧视 | 论文 | HyperAI超神经