3 个月前

人群中的无人机检测、跟踪与计数:一个基准评测

人群中的无人机检测、跟踪与计数:一个基准评测

摘要

为推动无人机拍摄视频中目标检测、跟踪与计数算法的发展,我们构建了一个新的基准测试平台,其核心是一个名为 DroneCrowd 的大规模无人机视频数据集。该数据集由112段视频片段组成,包含33,600帧高清视频画面,覆盖多种复杂场景。值得注意的是,我们对其中20,800条人员轨迹进行了标注,共包含480万个人头实例,并标注了多个视频级别的属性信息。与此同时,我们提出了一种名为时空邻域感知网络(Space-Time Neighbor-Aware Network, STNNet)的强基准模型,用于在密集人群场景下联合完成目标检测、跟踪与计数任务。STNNet由特征提取模块、密度图估计分支,以及定位与关联子网络构成。为充分挖掘邻近目标之间的上下文信息,我们设计了邻域上下文损失(neighboring context loss),用于指导关联子网络的训练,该损失函数强制在时间维度上保持相邻目标之间的相对位置一致性。在 DroneCrowd 数据集上的大量实验表明,STNNet 在各项任务上均显著优于当前最先进的方法,展现出优异的性能与鲁棒性。

代码仓库

VisDrone/DroneCrowd
官方
pytorch

基准测试

基准方法指标
crowd-counting-on-up-countSTNNet
L-AP@10: 28.48

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
人群中的无人机检测、跟踪与计数:一个基准评测 | 论文 | HyperAI超神经