6 个月前

摘要

尽管深度模型在图像识别任务中表现出色，但其对常见的图像退化（如模糊、噪声、低分辨率）仍较为敏感。数据增强是传统上用于提升模型鲁棒性的一种方法，即在训练过程中引入这些常见退化类型以增强模型的泛化能力。然而，若采用简单的数据增强策略，模型可能无法针对特定类型的退化进行有效学习，因为其倾向于学习各类退化之间的平均分布，从而导致模型缺乏针对性。为解决该问题，我们提出一种全新的深度图像识别网络训练范式，通过可逆神经架构从任意质量的图像中提取类清晰特征。该方法包含两个阶段：第一阶段，仅使用清晰图像训练一个可逆网络，目标是实现图像识别；第二阶段，将该网络的逆过程（即可逆解码器）接入一个新的识别网络，构建一个编码器-解码器架构，并联合使用清晰图像与退化图像进行训练，同时优化图像识别与图像重建双重目标。该两阶段策略使网络能够通过可逆解码器重建出清晰图像，从而从任意质量的输入图像中提取出类清晰且具备鲁棒性的特征表示。我们在图像分类与人脸识别任务上验证了该方法的有效性。

源 PDF 查看代码