3 个月前

基于深度学习模型的乌尔都语在线评论情感分析

基于深度学习模型的乌尔都语在线评论情感分析

摘要

现有大多数研究集中于英语、西班牙语、汉语、日语等主流语言,然而尽管乌尔都语拥有超过六千万母语使用者,相关研究却相对匮乏。本文针对这一资源匮乏的语言,构建了一种深度学习模型,用于分析其文本中的情感表达。我们构建了一个开源语料库,包含来自566个在线讨论帖的10,008条评论,内容涵盖体育、食品、软件、政治和娱乐等主题。本研究旨在实现两个目标:(a)为乌尔都语情感分析研究提供一个人工标注的语料库;(b)利用该语料库对当前主流模型的性能进行评估。为评估模型性能,我们采用了二分类与三分类任务,并对比了多种模型,包括长短期记忆网络(LSTM)、循环卷积神经网络(RCNN)、基于规则的方法、N-gram模型、支持向量机(SVM)以及卷积神经网络(CNN)等。实验结果表明,RCNN模型在二分类任务中达到84.98%的准确率,在三分类任务中达到68.56%的准确率,优于其他标准模型。为便于同领域研究者开展进一步工作,本文已将所构建的语料库及实验代码全部开源。

基准测试

基准方法指标
sentiment-analysis-on-urdu-online-reviewsRCNN
Average F1: 84.48

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于深度学习模型的乌尔都语在线评论情感分析 | 论文 | HyperAI超神经