3 个月前

FooDI-ML:一个大规模多语言食品、饮料和杂货图像与描述数据集

FooDI-ML:一个大规模多语言食品、饮料和杂货图像与描述数据集

摘要

本文介绍了FooDI-ML数据集。该数据集包含超过150万张唯一图像,以及超过950万条来自Glovo应用的商店名称、产品名称、描述信息和商品分类信息。所提供的数据涵盖欧洲、中东、非洲及拉丁美洲37个国家的食品、饮料和杂货类商品。数据集共包含33种语言,其中包括来自东欧和西亚国家的87万条语言样本,如乌克兰语和哈萨克语,这些语言在以往公开的视觉-语言数据集中长期处于代表性不足的状态。此外,数据集还包含西班牙语、英语等广泛使用的语言。为促进后续研究,我们还提供了两项任务的基准测试:文本-图像检索与条件图像生成。

代码仓库

glovo/foodi-ml-dataset
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
image-retrieval-on-foodi-ml-globalADAPT-I2T
A-R@1: 0.005
A-R@10: 0.05
A-R@5: 0.02
Re-R@1: 0.01
Re-R@10: 0.045
Re-R@5: 0.03
image-retrieval-on-foodi-ml-spainADAPT-I2T
A-R@1: 0.93
A-R@10: 5.8
A-R@5: 3.33
Re-R@1: 0.73
Re-R@10: 5.67
Re-R@5: 2.93

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
FooDI-ML:一个大规模多语言食品、饮料和杂货图像与描述数据集 | 论文 | HyperAI超神经