3 个月前

基于上下文词嵌入的主观偏见检测

基于上下文词嵌入的主观偏见检测

摘要

主观偏见检测在宣传内容识别、内容推荐、情感分析以及偏见中和等应用中具有重要意义。这种偏见通常通过具有煽动性的词汇和表达方式、对事实提出质疑以及预设某种观点为真等方式在自然语言中体现。本文基于BERT模型,在维基百科中立性语料库(Wiki Neutrality Corpus, WNC)上开展了一系列全面的实验,以检测主观偏见。该语料库包含36万条标注样本,均来自维基百科编辑中移除各类偏见行为的记录。此外,本文提出了一种基于BERT的集成模型,其性能显著优于当前最先进的方法(如BERT_large),F1得分提升了5.6个百分点。

代码仓库

基准测试

基准方法指标
bias-detection-on-wiki-neutrality-corpusRoBERTa+ALBERT
F1: 70.4

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于上下文词嵌入的主观偏见检测 | 论文 | HyperAI超神经