
摘要
在过去的十年中,卷积神经网络(CNN)模型在解决复杂的视觉问题方面取得了巨大成功。然而,这些深度模型由于其内部机制缺乏透明度而被视为“黑箱”方法。近期,开发可解释的深度学习模型引起了广泛的关注,本文正是在这方面做出的努力。基于最近提出的一种称为Grad-CAM的方法,我们提出了一种改进的通用方法——Grad-CAM++,该方法在对象定位和解释单个图像中多个对象实例方面提供了比现有最先进方法更好的可视化解释。我们为所提出的Grad-CAM++方法提供了一个数学推导过程,该方法利用最后一层卷积特征图对特定类别的得分的正偏导数的加权组合作为权重,生成对应类别标签的可视化解释。我们的大量实验和评估(包括主观和客观评估)在标准数据集上表明,Grad-CAM++能够为给定的CNN架构在多种任务中(如分类、图像描述生成和3D动作识别)以及新的应用场景(如知识蒸馏)提供有前景且人类可理解的可视化解释。
代码仓库
sicara/tf-explain
tf
GitHub 中提及
lisssse14/Grad_CAM_PLUS_PLUS
tf
GitHub 中提及
Ecgbert/Grad_CAM_PLUS_PLUS
tf
GitHub 中提及
totti0223/gradcamplusplus
GitHub 中提及
frgfm/torch-cam
pytorch
GitHub 中提及
tristangomez44/metrics-saliency-maps
pytorch
GitHub 中提及
yunqing-me/attackvlm
pytorch
GitHub 中提及
FelixMQuintana/Deep-Vasp-E
tf
GitHub 中提及
vcowwy/paddle-grad-cam
paddle
GitHub 中提及
yiskw713/SmoothGradCAMplusplus
pytorch
GitHub 中提及
samson6460/tf.keras-gradcamplusplus
tf
GitHub 中提及
eknim/gradcamplusplus
GitHub 中提及
samson6460/tf_keras_gradcamplusplus
tf
GitHub 中提及
jacobgil/pytorch-grad-cam
pytorch
GitHub 中提及
v1an1/gradcamplusplus-cats-v-dogs
tf
GitHub 中提及
samson6460/tf-keras-gradcamplusplus
tf
GitHub 中提及
yiskw713/ClassActivationMapping
pytorch
GitHub 中提及
yiskw713/scorecam
pytorch
GitHub 中提及
HollrayChan/gradcam-plus-plus
pytorch
GitHub 中提及
ftorres11/saliencysense
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 | 
|---|---|---|
| error-understanding-on-cub-200-2011-1 | Grad-CAM++ | Average highest confidence (EfficientNetV2-M): 0.2659 Average highest confidence (MobileNetV2): 0.3462 Average highest confidence (ResNet-101): 0.2647 Insertion AUC score (EfficientNetV2-M): 0.1605 Insertion AUC score (MobileNetV2): 0.1284 Insertion AUC score (ResNet-101): 0.1094 | 
| error-understanding-on-cub-200-2011-resnet | Grad-CAM++ | Average highest confidence: 0.2647 Insertion AUC score: 0.1094 |