4 个月前

细粒度图像分类中输出嵌入的评估

细粒度图像分类中输出嵌入的评估

摘要

近年来,随着大规模图像数据集的可用,图像分类技术取得了显著进展。然而,细粒度分类仍然是一个主要挑战,因为大量细粒度类别需要高昂的标注成本。本项目表明,即使没有标记的训练数据,也可以在这些类别上实现令人信服的分类性能。通过给定的图像和类别嵌入(embeddings),我们学习了一个兼容性函数,使得匹配的嵌入得分高于不匹配的嵌入;零样本图像分类的过程是找到具有最高联合兼容性得分的标签。我们使用最先进的图像特征,并专注于不同的监督属性和非监督输出嵌入(output embeddings),这些输出嵌入要么从层次结构中派生,要么从未标记的文本语料库中学习得到。我们在“带属性的动物”(Animals with Attributes)和“加州理工-UCSD鸟类”(Caltech-UCSD Birds)数据集上建立了显著改进的新基准。最令人鼓舞的是,我们证明了完全非监督的输出嵌入(从维基百科学习并用细粒度文本改进)可以取得令人信服的结果,甚至超过了之前的监督方法的最佳水平。通过结合不同的输出嵌入,我们进一步提高了结果。

代码仓库

基准测试

基准方法指标
few-shot-image-classification-on-cub-200-0SJE
Accuracy: 50.1%
few-shot-image-classification-on-cub-200-2011-1SJE
Top-1 Accuracy: 50.1%
few-shot-image-classification-on-cub-200-50SJE Akata et al. (2015)
Accuracy: 50.1
zero-shot-action-recognition-on-hmdb51SJE(word embedding)
Top-1 Accuracy: 13.3
zero-shot-action-recognition-on-kineticsSJE(Word Embedding)
Top-1 Accuracy: 22.3
Top-5 Accuracy: 48.2
zero-shot-action-recognition-on-olympicsSJE(Atrribute)
Top-1 Accuracy: 47.5
zero-shot-action-recognition-on-olympicsSJE(Word Embedding)
Top-1 Accuracy: 28.6
zero-shot-action-recognition-on-ucf101SJE(Attribute)
Top-1 Accuracy: 12.0
zero-shot-action-recognition-on-ucf101SJE(Word Embedding)
Top-1 Accuracy: 9.9

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
细粒度图像分类中输出嵌入的评估 | 论文 | HyperAI超神经