4 个月前

在细粒度视觉分类中实现更好的识别效果:弱监督数据增强网络

在细粒度视觉分类中实现更好的识别效果:弱监督数据增强网络

摘要

数据增强通常用于增加训练数据量,防止过拟合并提高深度模型的性能。然而,在实际应用中,随机数据增强方法(如随机图像裁剪)效率较低,可能会引入许多无法控制的背景噪声。在本文中,我们提出了一种弱监督数据增强网络(WS-DAN),以探索数据增强的潜力。具体而言,对于每张训练图像,我们首先通过弱监督学习生成注意力图来表示对象的判别部分。接下来,我们在这些注意力图的引导下对图像进行增强,包括注意力裁剪和注意力丢弃。所提出的WS-DAN从两个方面提高了分类准确性。第一阶段,由于提取了更多判别部分的特征,图像可以被更好地识别。第二阶段,注意力区域提供了对象的精确位置信息,使我们的模型能够更近距离地关注对象,从而进一步提升性能。在常见的细粒度视觉分类数据集上的全面实验表明,我们的WS-DAN超越了现有最先进方法,证明了其有效性。

代码仓库

Victory8858/WS-DAN-Paddle
paddle
GitHub 中提及
mv-lab/ViT-FGVC8
GitHub 中提及
wvinzh/WS_DAN_PyTorch
pytorch
GitHub 中提及
tau-yihouxiang/WS_DAN
tf
GitHub 中提及

基准测试

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
在细粒度视觉分类中实现更好的识别效果:弱监督数据增强网络 | 论文 | HyperAI超神经