
摘要
我们从俯视图像中创建了一个大型多样的汽车数据集,这些图像对于训练深度学习模型进行二分类、检测和计数非常有用。该数据集及相关材料将公开发布。数据集中包含有助于识别困难目标的上下文信息。我们使用名为ResCeption的神经网络在该数据集上展示了分类和检测的效果。该网络结合了残差学习(residual learning)和Inception风格的层,能够在一次查看中完成汽车计数。这是一种新的物体计数方法,而非通过定位或密度估计来实现。这种方法具有较高的准确性、速度快且易于实施。此外,计数方法并不特定于汽车或场景。很容易将此方法训练为对其他类型的物体进行计数,并且在新场景中进行计数时无需额外设置或假设物体位置。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| object-counting-on-carpk | One-Look Regression (2016) | MAE: 21.88 RMSE: 36.73 |