3 个月前

稀疏概念瓶颈模型：对比学习中的Gumbel技巧

Andrei Semenov Vladimir Ivanov Aleksandr Beznosikov Alexander Gasnikov

摘要

我们提出了一种新颖的可解释分类架构与方法——概念瓶颈模型（Concept Bottleneck Models, CBMs）。尽管当前图像分类任务的最先进（SOTA）方法通常作为“黑箱”运行，但对能够提供可解释结果的模型的需求正日益增长。这类模型通常通过引入目标实例的附加描述信息——即“概念”（concepts），来学习预测类别标签的分布。然而，现有的瓶颈模型方法存在诸多局限：其分类准确率通常低于标准模型，且CBMs需要额外的概念集合才能发挥作用。为此，我们提出一个框架，用于基于预训练的多模态编码器以及新型类似CLIP的架构构建概念瓶颈模型。通过引入一种新型的“概念瓶颈层”（Concept Bottleneck Layers），我们提出了三种训练策略：基于$\ell_1$损失、对比损失，以及基于Gumbel-Softmax分布的损失函数（即稀疏CBM，Sparse-CBM）；而最终的全连接层仍采用交叉熵损失进行训练。实验结果表明，在基于CLIP的瓶颈模型中引入稀疏隐藏层可显著提升分类准确率，这表明概念激活向量的稀疏表示在概念瓶颈模型中具有实际意义。此外，借助我们提出的“概念矩阵搜索”（Concept Matrix Search）算法，可在无需任何额外训练或微调的情况下，有效提升CLIP模型在复杂数据集上的预测性能。相关代码已公开，地址为：https://github.com/Andron00e/SparseCBM。

代码仓库

andron00e/sparsecbm

官方

pytorch

GitHub 中提及

icml24/sparsecbm

官方

pytorch

基准测试

基准	方法	指标
image-classification-on-cub-200-2011-3	Sparse-CBM	Accuracy: 80.02

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程

即用型 GPU

最优价格

立即开始

Hyper Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供