3 个月前

基于图神经网络的伊斯兰教仇恨言论可解释性识别

基于图神经网络的伊斯兰教仇恨言论可解释性识别

摘要

网络平台上的反伊斯兰言论助长了偏见与不宽容,因此对其进行有效识别与清除对于促进社会和谐至关重要。传统仇恨言论检测模型主要依赖自然语言处理(NLP)技术,如分词、词性标注以及编码器-解码器架构等方法。然而,图神经网络(Graph Neural Networks, GNNs)凭借其能够建模数据点之间复杂关系的能力,在仇恨言论检测方面展现出更高的有效性与更强的可解释性。本文提出一种新范式,将言论表示为图中的节点,并根据其上下文关联性与语义相似度构建节点间的边,从而构建语义图结构。该研究利用GNN模型识别并解释针对伊斯兰教的仇恨言论,通过预训练NLP模型生成的词嵌入连接文本,深入理解仇恨言论的语境与模式。实验结果表明,该方法在检测性能上达到当前最优水平,显著提升了识别准确率,同时提供了具有实际意义的解释能力。这一成果凸显了图神经网络在应对网络仇恨言论方面的巨大潜力,有助于构建更加安全、包容的网络环境。

基准测试

基准方法指标
hate-speech-detection-on-hatexplainXG-HSI-BiRNN
Accuracy: 0.742
Macro-F1: 0.737
hate-speech-detection-on-hatexplainXG-HSI-BERT
Accuracy: 0.751
Macro-F1: 0.747

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于图神经网络的伊斯兰教仇恨言论可解释性识别 | 论文 | HyperAI超神经