6 个月前

卷积神经网络

计算机视觉

Guangyao Chen Peixi Peng Li Ma Jia Li Lin Du Yonghong Tian

摘要

近年来，通过频域成分分解的解释技术，卷积神经网络（CNN）的泛化行为逐渐被揭示。然而，图像相位谱在构建鲁棒视觉系统中的重要性仍未得到足够重视。本文发现，CNN倾向于收敛至与训练图像高频成分密切相关的局部最优解，而幅值谱则容易受到噪声或常见退化因素的干扰。相比之下，大量实证研究表明，人类视觉系统更依赖相位成分来实现鲁棒的识别能力。基于这一观察，本文进一步揭示了CNN在应对常见扰动时的泛化特性及其在分布外检测中的表现，并由此提出一种新的数据增强思路：将当前图像的相位谱与干扰图像的幅值谱重新组合，生成新的训练样本。该方法迫使CNN更加关注来自相位成分的结构化信息，同时增强对幅值变化的鲁棒性。在多个图像数据集上的实验结果表明，所提出的方法在多项泛化与校准任务中均达到当前最优性能，包括对常见退化与表面变化的适应能力、分布外样本检测以及对抗攻击下的鲁棒性。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

卷积神经网络

计算机视觉

Guangyao Chen Peixi Peng Li Ma Jia Li Lin Du Yonghong Tian

摘要

近年来，通过频域成分分解的解释技术，卷积神经网络（CNN）的泛化行为逐渐被揭示。然而，图像相位谱在构建鲁棒视觉系统中的重要性仍未得到足够重视。本文发现，CNN倾向于收敛至与训练图像高频成分密切相关的局部最优解，而幅值谱则容易受到噪声或常见退化因素的干扰。相比之下，大量实证研究表明，人类视觉系统更依赖相位成分来实现鲁棒的识别能力。基于这一观察，本文进一步揭示了CNN在应对常见扰动时的泛化特性及其在分布外检测中的表现，并由此提出一种新的数据增强思路：将当前图像的相位谱与干扰图像的幅值谱重新组合，生成新的训练样本。该方法迫使CNN更加关注来自相位成分的结构化信息，同时增强对幅值变化的鲁棒性。在多个图像数据集上的实验结果表明，所提出的方法在多项泛化与校准任务中均达到当前最优性能，包括对常见退化与表面变化的适应能力、分布外样本检测以及对抗攻击下的鲁棒性。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

幅值-相位重组合：从频域视角重新思考卷积神经网络的鲁棒性 | 论文 | HyperAI超神经