4 个月前

通过检索引导的对比学习改进仇恨模因检测

通过检索引导的对比学习改进仇恨模因检测

摘要

仇恨表情包已成为互联网上的一个重要问题。检测仇恨表情包需要系统同时理解图像和文本模态。我们的研究发现,现有的基于CLIP的系统在嵌入空间中缺乏对细微差异的敏感度,而这些差异对于正确的仇恨分类至关重要。我们提出通过检索引导的对比训练构建一个具有仇恨意识的嵌入空间。该方法在HatefulMemes数据集上取得了87.0的AUROC(Area Under Receiver Operating Characteristic Curve),优于许多更大规模的微调多模态模型。我们展示了一个基于检索的仇恨表情包检测系统,该系统能够根据未在训练中出现的数据识别仇恨内容。这使得开发人员可以通过简单地添加新示例来更新仇恨表情包检测系统,而无需重新训练,这是在互联网上不断演变的仇恨表情包环境中实际服务所需的理想特性。

代码仓库

JingbiaoMei/RGCL
官方
pytorch

基准测试

基准方法指标
hateful-meme-classification-on-harm-pRGCL
Accuracy: 89.9
F1: 89.5
hateful-meme-classification-on-harmemeRGCL
AUROC: 91.80
Accuracy: 87.00
hateful-meme-classification-on-pridemmRGCL
Accuracy: 76.3
F1: 76.5
meme-classification-on-hateful-memesRGCL (CLIP)
Accuracy: 0.788
ROC-AUC: 0.870
meme-classification-on-multioffRGCL
Accuracy: 67.1
F1: 58.1

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
通过检索引导的对比学习改进仇恨模因检测 | 论文 | HyperAI超神经