
摘要
在众多视觉任务中,多尺度特征表示具有重要意义。近年来,骨干卷积神经网络(CNNs)的不断进步展示了更强的多尺度表示能力,从而在广泛的应用中实现了持续的性能提升。然而,大多数现有方法以层的方式表示多尺度特征。本文提出了一种新型的CNN构建模块,即Res2Net,通过在一个单一的残差块内构建层次化的类似残差连接来实现这一目标。Res2Net在细粒度级别上表示多尺度特征,并扩大了每个网络层的感受野范围。所提出的Res2Net模块可以嵌入到最先进的骨干CNN模型中,例如ResNet、ResNeXt和DLA。我们在这些模型上评估了Res2Net模块,并在广泛使用的数据集(如CIFAR-100和ImageNet)上展示了相对于基线模型的一致性能提升。进一步的消融研究和在代表性计算机视觉任务(即目标检测、类别激活映射和显著物体检测)上的实验结果进一步验证了Res2Net相对于最先进基线方法的优势。源代码和训练好的模型可在https://mmcheng.net/res2net/ 获取。
代码仓库
zhuhongwei1999/bsa-net
pytorch
GitHub 中提及
rwightman/pytorch-image-models
pytorch
GitHub 中提及
ChrisMats/Res2Net
pytorch
GitHub 中提及
tuanzhangCS/res2net-on-mxnet
mxnet
GitHub 中提及
yfreedomliTHU/Res2Net
pytorch
GitHub 中提及
Res2Net/Res2Net-PretrainedModels
pytorch
GitHub 中提及
PaddlePaddle/PaddleClas
paddle
open-mmlab/mmdetection
pytorch
kingcong/res2net
mindspore
GitHub 中提及
IMvision12/keras-vision-models
pytorch
GitHub 中提及
open-mmlab/mmclassification
pytorch
Res2Net/Res2Net-PoolNet
pytorch
GitHub 中提及
osmr/imgclsmob
mxnet
GitHub 中提及
Mind23-2/MindCode-114
mindspore
Res2Net/mmdetection
pytorch
Res2Net/Res2Net-maskrcnn
pytorch
GitHub 中提及
Res2Net/Res2Net-Pose-Estimation
pytorch
GitHub 中提及
fupiao1998/res2net-keras
tf
GitHub 中提及
gasvn/Res2Net
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| image-classification-on-cifar-100 | Res2NeXt-29 | Percentage correct: 83.44 |
| image-classification-on-gashissdb | Res2Net-50 | Accuracy: 98.68 F1-Score: 99.29 Precision: 99.91 |
| image-classification-on-imagenet | Res2Net-50-299 | Top 1 Accuracy: 78.59% |
| image-classification-on-imagenet | Res2Net-101 | Top 1 Accuracy: 81.23% |
| instance-segmentation-on-coco-minival | Faster R-CNN (Res2Net-50) | AP50: 57.6 APL: 53.7 APM: 37.9 APS: 15.7 mask AP: 35.6 |
| instance-segmentation-on-coco-minival | Res2Net-101+HTC | mask AP: 41.3 |
| medical-image-classification-on-nct-crc-he | Res2Net-50 | Accuracy (%): 93.37 F1-Score: 96.25 Precision: 99.93 Specificity: 99.17 |
| object-detection-on-coco-minival | Faster R-CNN (Res2Net-50) | AP50: 53.6 APL: 51.1 APM: 38.3 APS: 14 box AP: 33.7 |
| object-detection-on-coco-minival | Res2Net101+HTC | AP50: 66.5 AP75: 51.3 APL: 62.1 APM: 51.6 APS: 28.6 box AP: 47.5 |
| salient-object-detection-on-dut-omron | DSS (Res2Net-50) | F-measure: 0.800 MAE: 0.071 |
| salient-object-detection-on-ecssd | DSS (Res2Net-50) | F-measure: 0.926 MAE: 0.056 |
| salient-object-detection-on-hku-is | DSS (Res2Net-50) | F-measure: 0.905 MAE: 0.05 |
| salient-object-detection-on-pascal-s | DSS (Res2Net-50) | F-measure: 0.841 MAE: 0.099 |
| semantic-segmentation-on-pascal-voc-2012-val | Deeplab v3+ (Res2Net-101) | mIoU: 79.3% |