4 个月前

一种用于识别英语混码文本和单语文本中攻击行为的统一系统

一种用于识别英语混码文本和单语文本中攻击行为的统一系统

摘要

社交媒体平台的广泛使用增加了攻击性的风险,这导致了心理压力,并对人们的生活产生了负面影响,如心理痛苦、攻击行为和对他人的不尊重。大多数此类对话包含混合编码语言[28]。此外,表达思想的方式或沟通风格在不同的社交媒体平台上也有所不同(例如,Twitter 和 Facebook 的沟通风格不同)。这些因素都增加了问题的复杂性。为了解决这些问题,我们引入了一种统一且强大的多模态深度学习架构,该架构既适用于英语混合编码数据集,也适用于单语英语数据集。所设计的系统采用了心理语言学特征和非常基础的语言学特征。我们的多模态深度学习架构包括深层金字塔卷积神经网络(Deep Pyramid CNN)、池化双向长短期记忆网络(Pooled BiLSTM)以及断开连接的递归神经网络(Disconnected RNN),后者同时使用了 Glove 和 FastText 嵌入。最终,系统根据模型平均的结果做出决策。我们在英语混合编码 TRAC 2018 数据集和从 Kaggle 获得的单语英语数据集上评估了我们的系统。实验结果表明,我们提出的系统在这两类数据集上的表现均优于所有先前的方法。

基准测试

基准方法指标
text-classification-on-facebook-mediaOur proposed method Model Averaging(D + E + F)
F1 (Hidden Test Set): 0.677
text-classification-on-twitter-usOur proposed method Model Averaging(D + E + F)
F1 (Hidden Test Set): 0.648

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
一种用于识别英语混码文本和单语文本中攻击行为的统一系统 | 论文 | HyperAI超神经