
摘要
本文对EfficientNet图像分类器在多种近期训练方法下的性能进行了全面分析,特别关注一种能够校正训练图像与测试图像之间差异的训练策略。由此提出的新型网络结构称为FixEfficientNet,在参数量相同的情况下,显著超越了原始架构的性能表现。例如,我们所提出的无需额外训练数据的FixEfficientNet-B0在ImageNet数据集上达到了79.3%的top-1准确率,参数量仅为530万。这一结果相比使用3亿张未标注图像通过“噪声学生”(Noisy Student)策略训练的EfficientNet-B0,实现了+0.5%的绝对性能提升。此外,一个在3亿张未标注图像上通过弱监督预训练、并进一步结合FixRes优化的EfficientNet-L2模型,在单裁剪(single crop)设置下取得了88.5%的top-1准确率(top-5:98.7%),创下ImageNet任务的新纪录。上述性能提升均在比传统ImageNet评估协议更为严谨的实验设置下进行了系统性验证。特别地,我们证明了所提方法在ImageNet-v2测试集(对过拟合更具鲁棒性)以及ImageNet Real标签数据集上的有效性,两种情况下均建立了新的性能标杆,进一步验证了方法的泛化能力与可靠性。
代码仓库
facebookresearch/FixRes
官方
pytorch
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| image-classification-on-imagenet | FixEfficientNet-B2 | Number of params: 9.2M Top 1 Accuracy: 83.6% |
| image-classification-on-imagenet | FixEfficientNet-B8 | Top 1 Accuracy: 85.7% |
| image-classification-on-imagenet | FixEfficientNet-B4 | Number of params: 19M Top 1 Accuracy: 85.9% |
| image-classification-on-imagenet | FixEfficientNet-L2 | GFLOPs: 585 Hardware Burden: Number of params: 480M Operations per network pass: Top 1 Accuracy: 88.5% |
| image-classification-on-imagenet | FixEfficientNetB4 | Number of params: 19M Top 1 Accuracy: 84.0% |
| image-classification-on-imagenet | FixEfficientNet-B7 | GFLOPs: 82 Number of params: 66M Top 1 Accuracy: 87.1% |
| image-classification-on-imagenet | FixEfficientNet-B1 | Number of params: 7.8M Top 1 Accuracy: 82.6% |
| image-classification-on-imagenet | FixEfficientNet-B3 | Number of params: 12M Top 1 Accuracy: 85% |
| image-classification-on-imagenet | FixEfficientNet-B6 | Number of params: 43M Top 1 Accuracy: 86.7% |
| image-classification-on-imagenet | FixEfficientNet-B0 | GFLOPs: 1.60 Number of params: 5.3M Top 1 Accuracy: 80.2% |
| image-classification-on-imagenet | FixEfficientNet-B5 | Number of params: 30M Top 1 Accuracy: 86.4% |
| image-classification-on-imagenet-real | FixEfficientNet-L2 | Accuracy: 90.9% Params: 480M |
| image-classification-on-imagenet-real | FixEfficientNet-B8 | Accuracy: 90.0% Params: 87M |