
摘要
人群计数与定位在计算机视觉领域的重要性日益凸显,其应用范围广泛。尽管基于点的方法在人群计数中已被广泛应用,但其面临一个关键挑战:缺乏有效的学习策略来指导预测点与目标点之间的匹配过程。这一缺陷导致预测点与真实目标点之间的匹配不稳定,进而影响整体性能。为解决该问题,本文提出一种有效方法,用于稳定基于点的方法中的预测点与目标点匹配过程。我们引入辅助点引导(Auxiliary Point Guidance, APG),为预测点的选择与优化提供清晰且有效的指导,从而解决匹配不确定性这一核心问题。此外,我们设计了隐式特征插值(Implicit Feature Interpolation, IFI),实现对不同人群场景下特征的自适应提取,进一步提升模型的鲁棒性与精度。大量实验结果表明,所提方法在人群计数与定位任务中均表现出显著性能提升,尤其在复杂场景下优势更为明显。相关源代码与训练好的模型将公开发布,以促进后续研究。
代码仓库
AaronCIH/APGCC
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| crowd-counting-on-jhu-crowd | APGCC | MAE: 54.3 MSE: 225.9 |
| crowd-counting-on-nwpu-crowd | APGCC | MAE: 71.7 MSE: 284.4 |
| crowd-counting-on-shanghaitech-a | APGCC | MAE: 48.8 MSE: 76.7 |
| crowd-counting-on-shanghaitech-b | APGCC | MAE: 8.7 |
| crowd-counting-on-ucf-cc-50 | APGCC | MAE: 154.8 MSE: 205.5 |
| crowd-counting-on-ucf-qnrf | APGCC | MAE: 80.1 MSE: 136.6 |