3 个月前

基于解释的跨域少样本分类训练

基于解释的跨域少样本分类训练

摘要

跨域少样本分类任务(Cross-domain Few-shot Classification, CD-FSC)将少样本分类与跨数据集域泛化的要求相结合。该任务面临两大挑战:一是每个类别中可用的标注数据极为有限;二是训练集与测试集之间存在域偏移(domain shift)。本文提出一种针对现有少样本分类(FSC)模型的新型训练方法,该方法利用现有解释方法对FSC模型预测结果所生成的解释得分,并基于模型中间特征图进行计算。首先,我们对层间相关性传播(Layer-wise Relevance Propagation, LRP)方法进行了适配,使其能够解释FSC模型的预测结果。其次,我们设计了一种模型无关的解释引导训练策略,该策略能够动态识别并强化对预测结果具有关键作用的特征。本文的贡献并非提出一种新的解释方法,而在于将现有解释技术创新性地应用于模型训练阶段。实验结果表明,基于解释的引导训练显著提升了模型的泛化能力。我们在五个少样本学习数据集(miniImageNet、CUB、Cars、Places 和 Plantae)上验证了该方法的有效性,发现其在三种不同的FSC模型——RelationNet、交叉注意力网络(cross-attention network)以及基于图神经网络(GNN)的模型——上均实现了准确率的提升。相关源代码已公开,获取地址为:https://github.com/SunJiamei/few-shot-lrp-guided

代码仓库

基准测试

基准方法指标
cross-domain-few-shot-on-chestxLRP
5 shot: 24.53
cross-domain-few-shot-on-eurosatLRP
5 shot: 77.14
cross-domain-few-shot-on-isic2018LRP
5 shot: 44.14

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于解释的跨域少样本分类训练 | 论文 | HyperAI超神经