
摘要
人类能够仅凭少量标注样本就识别新物体,然而,少样本学习(few-shot learning)对机器学习系统而言仍然是一个具有挑战性的问题。以往大多数少样本学习算法仅利用图像的空域信息。本文提出将频率信息融入学习模型,以增强系统的判别能力。我们采用离散余弦变换(Discrete Cosine Transform, DCT)生成图像的频率表示,并将空域特征与频率域特征进行融合,用于分类任务。所提出的策略在多种骨干网络、数据集及算法上均得到验证,实验结果表明其有效性。大量实验证明,频率信息与空域表示具有良好的互补性,在不同的少样本学习任务中,通过融合空域与频率域特征,显著提升了分类准确率。
代码仓库
xiangyu8/PT-MAP-sf
官方
pytorch
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| few-shot-image-classification-on-cub-200-5-1 | PT+MAP+SF (transductive) | Accuracy: 95.48 |
| few-shot-image-classification-on-mini-2 | PT+MAP (s+f) (transductive) | Accuracy: 84.81 |