4 个月前

YOLOStereo3D:回归2D以实现高效的立体3D检测

YOLOStereo3D:回归2D以实现高效的立体3D检测

摘要

基于立体相机的三维目标检测是计算机视觉中的一个重要问题,特别是在没有激光雷达(LiDAR)的低成本自主移动机器人中尤为重要。目前,大多数性能最佳的立体三维目标检测框架都是基于从视差估计进行密集深度重建的方法,这使得它们在计算上非常昂贵。为了实现双目图像视觉检测在实际场景中的部署,我们退一步从基于二维图像的目标检测框架中汲取灵感,并结合立体特征对其进行增强。我们将实时单阶段2D/3D目标检测器的知识和推理结构融入其中,并引入了一个轻量级的立体匹配模块。我们提出的框架YOLOStereo3D在一个单GPU上进行训练,并且运行速度超过每秒十帧。该框架在不使用激光雷达数据的情况下,展示了与最先进的立体三维检测框架相当的性能。代码将在https://github.com/Owen-Liuyuxuan/visualDet3D发布。

代码仓库

基准测试

基准方法指标
3d-object-detection-from-stereo-images-on-1YoLoStereo3D
AP75: 41.25
3d-object-detection-from-stereo-images-on-2YoLoStereo3D
AP50: 19.75

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
YOLOStereo3D:回归2D以实现高效的立体3D检测 | 论文 | HyperAI超神经