
摘要
人工场景可能非常密集,包含大量物体,这些物体往往相同且位置接近。我们表明,即使对于最先进的目标检测器而言,在此类场景中实现精确的目标检测仍然是一个具有挑战性的前沿问题。为此,我们提出了一种基于深度学习的新方法,专门针对这种具有挑战性的环境设计。我们的贡献包括:(1)用于估计Jaccard指数作为检测质量评分的层;(2)一种新颖的EM合并单元,该单元利用我们的质量评分解决检测重叠的不确定性;最后,(3)一个广泛注释的数据集SKU-110K,代表了密集的零售环境,并在极端条件下发布用于训练和测试。在SKU-110K上的检测测试和CARPK及PUCPR+上的计数测试显示,我们的方法显著优于现有的最先进方法。代码和数据将在\url{www.github.com/eg4000/SKU110K_CVPR19}上提供。
代码仓库
eg4000/SKU110K_CVPR19
官方
tf
GitHub 中提及
Media-Smart/SKU110K-DenseDet
pytorch
tyomj/product_detection
pytorch
GitHub 中提及
skrish13/SKU110K-benchmark
GitHub 中提及
skrish13/SKU110K-evaluation
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| dense-object-detection-on-sku-110k | Soft-IoU + EM-Merger unit | AP: 49.2 |
| object-counting-on-carpk | Soft-IoU + EM-Merger unit | MAE: 6.77 RMSE: 8.52 |