3 个月前

N24News:一种用于多模态新闻分类的新数据集

N24News:一种用于多模态新闻分类的新数据集

摘要

当前的新闻数据集主要关注新闻文本特征,很少利用图像特征,因而忽略了对新闻分类至关重要的大量信息。本文提出一个新数据集N24News,该数据集基于《纽约时报》构建,包含24个类别,每条新闻均同时包含文本与图像信息。我们采用多任务多模态方法进行实验,结果表明,相较于仅依赖文本的分类方法,多模态新闻分类在性能上显著更优,且根据文本长度的不同,分类准确率最高可提升8.11%。本研究揭示了多模态分类器与其子分类器之间的性能关联,并探讨了在新闻分类中应用多模态方法的潜在改进空间。实验结果表明,N24News具有推动多模态新闻研究的巨大潜力。

代码仓库

billywzh717/n24news
官方
GitHub 中提及

基准测试

基准方法指标
news-classification-on-n15newsMultimodal(ViT+BERT, Input: Image + Headline) - Dot
Accuracy: 0.8202
news-classification-on-n15newsBERT (Input: Abstract)
Accuracy: 0.8471
news-classification-on-n15newsBERT (Input: Caption)
Accuracy: 0.7792
news-classification-on-n15newsViT (Input: Image)
Accuracy: 0.6065
news-classification-on-n15newsBERT (Input: Headline)
Accuracy: 0.7727
news-classification-on-n15newsMultimodal(ViT+BERT, Input: Image + Body)
Accuracy: 0.9249
news-classification-on-n15newsMultimodal(ViT+BERT, Input: Image + Abstract)
Accuracy: 0.8610
news-classification-on-n15newsBERT (Input: Body)
Accuracy: 0.9203
news-classification-on-n15newsMultimodal(ViT+BERT, Input: Image + Caption) - Concatenate
Accuracy: 0.7951

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
N24News:一种用于多模态新闻分类的新数据集 | 论文 | HyperAI超神经