
摘要
以往研究普遍认为,提升卷积网络的空间不变性是实现精准目标计数的关键。然而,在对多种主流计数网络进行验证后,我们意外发现,过于严格的像素级空间不变性反而会导致密度图生成过程中出现过拟合噪声。为此,本文提出采用局部连接的高斯核替代原始卷积核,以估计密度图中的空间位置。这一设计旨在使特征提取过程能够有效激发密度图生成,从而缓解标注噪声带来的负面影响。受先前工作的启发,我们进一步引入低秩近似与平移不变性相结合的策略,以高效实现大规模高斯卷积的近似计算。本研究为后续研究指明了新的方向,即应深入探索如何合理放松过于严格的像素级空间不变性,以提升目标计数性能。我们在4种主流目标计数网络(即MCNN、CSRNet、SANet和ResNet-50)上评估了所提方法,并在7个广泛应用的基准数据集上针对三类典型应用场景(人群计数、车辆计数和植物计数)进行了大量实验。实验结果表明,所提方法显著优于现有最先进方法,在学习目标空间位置方面展现出优异的性能。
代码仓库
zhiqic/rethinking-counting
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| crowd-counting-on-jhu-crowd | GauNet (ResNet-50) | MAE: 58.2 MSE: 245.1 |
| crowd-counting-on-shanghaitech-a | GauNet (ResNet-50) | MAE: 54.8 MSE: 89.1 |
| crowd-counting-on-shanghaitech-b | GauNet (ResNet-50) | MAE: 6.0 |
| crowd-counting-on-ucf-cc-50 | GauNet (ResNet-50) | MAE: 186.3 |
| crowd-counting-on-ucf-qnrf | GauNet (ResNet-50) | MAE: 81.6 |
| object-counting-on-trancos | GauNet (ResNet-50) | MAE: 2.1 MSE: 2.6 |