3 个月前

用于细粒度汽车识别的具有空间加权池化的深度CNN

用于细粒度汽车识别的具有空间加权池化的深度CNN

摘要

细粒度车辆识别旨在识别车辆的类别信息,例如品牌、型号,甚至生产年份。近年来,大量研究表明,基于大规模数据集训练的深度卷积神经网络(DCNN)在多种通用物体分类任务中能够取得令人瞩目的性能。本文提出一种空间加权池化(Spatially Weighted Pooling, SWP)策略,显著提升了主流DCNN模型特征表示的鲁棒性与有效性。具体而言,SWP是一种新型池化层,包含预定义数量的空间加权掩码(或称池化通道)。该层在池化DCNN提取的特征时,利用其学习得到的掩码进行引导,从而衡量特征图中各空间单元在判别能力上的重要性。与现有在DCNN卷积特征图上采用均匀网格池化的方法相比,所提出的方法能够仅通过单一DCNN即可提取卷积特征并生成池化通道,因此在实现上仅需极少修改。此外,SWP层的参数可在DCNN的端到端训练过程中进行联合学习。我们将该方法应用于多个细粒度车辆识别数据集,实验结果表明,所提方法在性能上优于现有主流方法。在Stanford Cars-196数据集上,准确率从92.6%提升至93.1%;在最新的CompCars数据集上,准确率从91.2%显著提升至97.6%,进一步推动了该领域的技术水平。此外,我们在两个额外的大规模数据集上也进行了测试,均取得了令人瞩目的效果。

基准测试

基准方法指标
fine-grained-image-classification-on-carflagResNet101-swp
Accuracy: 96.70%
fine-grained-image-classification-on-carflag-1ResNet101-swp
Accuracy: 96.42%
fine-grained-image-classification-on-compcarsResNet101-swp
Accuracy: 97.6%
fine-grained-image-classification-on-stanfordResNet101-swp
Accuracy: 93.1%

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
用于细粒度汽车识别的具有空间加权池化的深度CNN | 论文 | HyperAI超神经