3 个月前

无需质量感知的图像识别:基于可逆解码器的方法

无需质量感知的图像识别:基于可逆解码器的方法

摘要

尽管深度模型在图像识别任务中表现出色,但其对常见的图像退化(如模糊、噪声、低分辨率)仍较为敏感。数据增强是传统上用于提升模型鲁棒性的一种方法,即在训练过程中引入这些常见退化类型以增强模型的泛化能力。然而,若采用简单的数据增强策略,模型可能无法针对特定类型的退化进行有效学习,因为其倾向于学习各类退化之间的平均分布,从而导致模型缺乏针对性。为解决该问题,我们提出一种全新的深度图像识别网络训练范式,通过可逆神经架构从任意质量的图像中提取类清晰特征。该方法包含两个阶段:第一阶段,仅使用清晰图像训练一个可逆网络,目标是实现图像识别;第二阶段,将该网络的逆过程(即可逆解码器)接入一个新的识别网络,构建一个编码器-解码器架构,并联合使用清晰图像与退化图像进行训练,同时优化图像识别与图像重建双重目标。该两阶段策略使网络能够通过可逆解码器重建出清晰图像,从而从任意质量的输入图像中提取出类清晰且具备鲁棒性的特征表示。我们在图像分类与人脸识别任务上验证了该方法的有效性。

基准测试

基准方法指标
domain-generalization-on-imagenet-cQualNet (ResNeXt101)
mean Corruption Error (mCE): 42.5
domain-generalization-on-imagenet-cQualNet (ResNet-50)
mean Corruption Error (mCE): 50.6

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
无需质量感知的图像识别:基于可逆解码器的方法 | 论文 | HyperAI超神经