
摘要
本文研究了少样本目标计数(few-shot object counting)问题,即在查询图像中统计由一个或多个支持图像(support images)所描述的示例对象的数量。该任务的主要挑战在于,目标对象在查询图像中可能高度密集分布,导致难以准确识别每一个独立对象。为应对这一难题,本文提出一种新颖的学习模块,包含相似性对比模块与特征增强模块。具体而言,给定一个支持图像和一个查询图像,我们首先在每个空间位置上对比二者投影后的特征,生成一个得分图(score map)。将所有支持图像对应的得分图进行聚合,并在示例维度与空间维度上进行归一化,从而得到一个可靠的相似性图(similarity map)。随后,利用所构建的逐点相似性作为加权系数,对查询图像的特征进行增强,融合支持图像的特征信息。该设计促使模型在分析查询图像时,更加关注与支持图像相似的区域,从而显著提升不同对象之间的边界清晰度。在多个基准数据集及不同的训练设置下进行的大量实验表明,本文方法在性能上显著优于现有最先进方法。例如,在近期发布的大型FSC-147数据集上,我们将平均绝对误差(MAE)从22.08降低至14.32,相对提升达35%。相关代码已开源,地址为:https://github.com/zhiyuanyou/SAFECount。
代码仓库
zhiyuanyou/SAFECount
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| crowd-counting-on-shanghaitech-a | SAFECount | MAE: 73.70 |
| crowd-counting-on-shanghaitech-b | SAFECount | MAE: 9.98 |
| object-counting-on-carpk | SAFECount | MAE: 5.33 RMSE: 7.04 |
| object-counting-on-fsc147 | SAFECount | MAE(test): 14.32 MAE(val): 15.28 RMSE(test): 85.54 RMSE(val): 47.20 |