4 个月前

用于细粒度车辆识别的渐进式多任务抗噪学习与蒸馏框架

用于细粒度车辆识别的渐进式多任务抗噪学习与蒸馏框架

摘要

细粒度车辆识别(FGVR)是智能交通系统中的一项基本且重要的技术,但由于其固有的类内变化而非常困难。以往大多数关于FGVR的研究主要集中在由不同拍摄角度、位置等因素引起的类内变化上,而图像噪声导致的类内变化则较少受到关注。本文提出了一种渐进多任务抗噪学习(PMAL)框架和一种渐进多任务蒸馏(PMD)框架,以解决因图像噪声而导致的FGVR中的类内变化问题。PMAL框架通过将图像去噪作为图像识别中的一个附加任务,并逐步迫使模型学习噪声不变性,从而实现高识别精度。PMD框架则将经过PMAL训练的模型的知识迁移到原始骨干网络中,生成的模型在识别精度上与PMAL训练的模型相当,但不会给原始骨干网络带来任何额外开销。结合这两种框架,我们在两个广泛使用的标准FGVR数据集——斯坦福汽车(Stanford Cars)和CompCars——以及三个基于监控图像的车辆类型分类数据集——北京理工大学(BIT)-车辆、车辆类型图像数据2(VTID2)和用于品牌型号识别的车辆图像数据集(VIDMMR)——上获得了显著超过现有最先进方法的识别精度,同时没有给原始骨干网络带来任何额外开销。源代码可在以下地址获取:https://github.com/Dichao-Liu/Anti-noise_FGVR

代码仓库

基准测试

基准方法指标
fine-grained-image-classification-on-compcarsResnet50 + PMAL
Accuracy: 99.1%
fine-grained-image-classification-on-stanfordTResnet-L + PMD
Accuracy: 97.3%

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
用于细粒度车辆识别的渐进式多任务抗噪学习与蒸馏框架 | 论文 | HyperAI超神经