3 个月前

使用全景视频在三维全景坐标系中进行多人员定位与追踪

使用全景视频在三维全景坐标系中进行多人员定位与追踪

摘要

三维全景多人定位与跟踪在诸多应用中具有重要意义,然而,传统基于激光雷达(LiDAR)设备的方法往往成本高昂,且由于需要处理点云数据,计算效率较低。为此,本文提出了一种低成本、高效且有效的解决方案。首先,我们利用四台普通摄像头获取全景视频。随后,结合相机几何关系与人体生物特征(如身高),将二维全景图像坐标中的人员位置映射至三维全景相机坐标系中。最后,通过关联人体外观特征与三维轨迹,生成三维轨迹片段(3D tracklets)。我们在三个数据集上验证了所提方法的有效性,其中包括我们自建的一个新数据集,实验涵盖了三维单视角多人定位、三维单视角多人跟踪以及三维全景多人定位与跟踪任务。相关代码与数据集已公开,地址为:\url{https://github.com/fandulu/MPLT}。

代码仓库

fandulu/MPLT
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
multi-object-tracking-on-mot15-3dMPLT
MOTA: 54.2

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
使用全景视频在三维全景坐标系中进行多人员定位与追踪 | 论文 | HyperAI超神经