
摘要
从少量样本中学习的能力是人类智能的标志。少样本学习旨在将这一能力扩展到机器上。受概率深度学习的潜力和力量的启发,我们提出了一种新颖的变分推断网络(命名为TRIDENT),用于少样本分类,该网络可以将图像表示解耦为语义和标签潜在变量,并以交织的方式同时推断它们。为了引入任务感知能力,作为TRIDENT推断机制的一部分,我们利用了一个新颖的内置注意力机制传导特征提取模块(称为AttFEX),在少样本任务中跨查询图像和支持图像提取信息。我们的大量实验结果验证了TRIDENT的有效性,并表明即使使用最简单的骨干网络,它在常用的miniImageNet和tieredImageNet数据集上也达到了新的最先进水平(分别提高了4%和5%),并且在最近具有挑战性的跨域miniImageNet → CUB场景中显著超越了现有的最佳跨域基线模型(最高提升了20%)。代码和实验细节可以在我们的GitHub仓库中找到:https://github.com/anujinho/trident
代码仓库
anujinho/trident
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| few-shot-image-classification-on-mini-2 | TRIDENT | Accuracy: 86.11 |
| few-shot-image-classification-on-mini-3 | TRIDENT | Accuracy: 95.95 |
| few-shot-image-classification-on-mini-5 | TRIDENT | Accuracy: 84.61 |
| few-shot-image-classification-on-mini-6 | TRIDENT | Accuracy: 80.74 |
| few-shot-image-classification-on-tiered | TRIDENT | Accuracy: 86.97 |
| few-shot-image-classification-on-tiered-1 | TRIDENT | Accuracy: 96.57 |