HyperAIHyperAI

Command Palette

Search for a command to run...

FooDI-ML:一个大规模多语言食品、饮料和杂货图像与描述数据集

David Amat Olóndriz Ponç Palau Puigdevall Adrià Salvador Palau

摘要

本文介绍了FooDI-ML数据集。该数据集包含超过150万张唯一图像,以及超过950万条来自Glovo应用的商店名称、产品名称、描述信息和商品分类信息。所提供的数据涵盖欧洲、中东、非洲及拉丁美洲37个国家的食品、饮料和杂货类商品。数据集共包含33种语言,其中包括来自东欧和西亚国家的87万条语言样本,如乌克兰语和哈萨克语,这些语言在以往公开的视觉-语言数据集中长期处于代表性不足的状态。此外,数据集还包含西班牙语、英语等广泛使用的语言。为促进后续研究,我们还提供了两项任务的基准测试:文本-图像检索与条件图像生成。


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
FooDI-ML:一个大规模多语言食品、饮料和杂货图像与描述数据集 | 论文 | HyperAI超神经