4 个月前

Grad-CAM++:改进的深度卷积网络可视化解释方法

Grad-CAM++:改进的深度卷积网络可视化解释方法

摘要

在过去的十年中,卷积神经网络(CNN)模型在解决复杂的视觉问题方面取得了巨大成功。然而,这些深度模型由于其内部机制缺乏透明度而被视为“黑箱”方法。近期,开发可解释的深度学习模型引起了广泛的关注,本文正是在这方面做出的努力。基于最近提出的一种称为Grad-CAM的方法,我们提出了一种改进的通用方法——Grad-CAM++,该方法在对象定位和解释单个图像中多个对象实例方面提供了比现有最先进方法更好的可视化解释。我们为所提出的Grad-CAM++方法提供了一个数学推导过程,该方法利用最后一层卷积特征图对特定类别的得分的正偏导数的加权组合作为权重,生成对应类别标签的可视化解释。我们的大量实验和评估(包括主观和客观评估)在标准数据集上表明,Grad-CAM++能够为给定的CNN架构在多种任务中(如分类、图像描述生成和3D动作识别)以及新的应用场景(如知识蒸馏)提供有前景且人类可理解的可视化解释。

基准测试

基准方法指标
error-understanding-on-cub-200-2011-1Grad-CAM++
Average highest confidence (EfficientNetV2-M): 0.2659
Average highest confidence (MobileNetV2): 0.3462
Average highest confidence (ResNet-101): 0.2647
Insertion AUC score (EfficientNetV2-M): 0.1605
Insertion AUC score (MobileNetV2): 0.1284
Insertion AUC score (ResNet-101): 0.1094
error-understanding-on-cub-200-2011-resnetGrad-CAM++
Average highest confidence: 0.2647
Insertion AUC score: 0.1094

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
Grad-CAM++:改进的深度卷积网络可视化解释方法 | 论文 | HyperAI超神经