3 个月前

SIM-OFE:面向细粒度视觉分类的结构信息挖掘与目标感知特征增强

SIM-OFE:面向细粒度视觉分类的结构信息挖掘与目标感知特征增强

摘要

细粒度视觉分类(Fine-Grained Visual Categorization, FGVC)旨在区分粗粒度类别下的多个子类别。由于不同子类别之间存在细微的类间差异,FGVC任务具有较高的挑战性。现有方法主要聚焦于学习显著的视觉模式,却忽视了如何捕捉物体内部结构信息,导致难以获取物体内部完整的判别区域,从而限制了FGVC性能的提升。为解决上述问题,本文提出一种结构信息挖掘与面向物体的特征增强方法(Structure Information Mining and Object-aware Feature Enhancement, SIM-OFE),旨在探索视觉对象的内部结构组成及其外观特征。具体而言,我们首先提出一种简单而有效的混合感知注意力模块,通过全局与局部显著性分析实现对视觉对象的精准定位。随后,设计了一种结构信息挖掘模块,用于建模物体内部关键区域的分布特性及其上下文关系,从而突出整个物体及具有判别性的区域,以更好地区分细微差异。最后,提出一种面向物体的特征增强模块,以注意力耦合的方式融合全局与局部判别性特征,构建强大的细粒度识别视觉表征。在三个主流FGVC基准数据集上的大量实验表明,所提出的SIM-OFE方法能够达到当前最优的性能水平,显著提升了细粒度视觉分类的准确率与鲁棒性。

基准测试

基准方法指标
fine-grained-image-classification-on-cub-200SIM-OFE
Accuracy: 92.3%
fine-grained-image-classification-on-stanford-1SIM-OFE
Accuracy: 93.3%

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
SIM-OFE:面向细粒度视觉分类的结构信息挖掘与目标感知特征增强 | 论文 | HyperAI超神经