4 个月前

图-RISE:图正则化图像语义嵌入

图-RISE:图正则化图像语义嵌入

摘要

学习图像表示以捕捉细粒度语义一直是具有挑战性和重要意义的任务,它使得许多应用如图像搜索和聚类成为可能。在本文中,我们提出了一种大规模神经图学习框架——图正则化图像语义嵌入(Graph-RISE),该框架使我们能够训练嵌入以区分前所未有的O(40M)超细粒度语义标签。Graph-RISE在多个评估任务上超越了现有的最先进的图像嵌入算法,包括图像分类和三元组排序。我们通过案例研究展示了基于Graph-RISE的图像检索在定性上能够有效捕捉语义,并且与现有最先进技术相比,能够在更接近人类感知的水平上区分细微差别。

代码仓库

基准测试

基准方法指标
image-classification-on-imagenetGraph-RISE (40M)
Top 1 Accuracy: 68.29%
image-classification-on-inaturalistGraph-RISE (40M)
Top 1 Accuracy: 31.12%
Top 5 Accuracy: 52.76%

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
图-RISE:图正则化图像语义嵌入 | 论文 | HyperAI超神经