3 个月前

H3DNet:基于混合几何基元的3D目标检测

H3DNet:基于混合几何基元的3D目标检测

摘要

我们提出H3DNet,该模型以无颜色的三维点云作为输入,输出一组带有方向的物体边界框(Bounding Box, BB)及其语义标签。H3DNet的核心思想是预测一组混合的几何基元,即边界框中心、边界框面中心以及边界框边中心。我们通过定义物体与这些几何基元之间的距离函数,将预测的几何基元转化为物体候选区域。该距离函数支持物体候选区域的连续优化,其局部极小值点能够生成高保真度的物体候选区域。随后,H3DNet采用匹配与精炼模块,将候选区域分类为检测到的物体,并对检测到的物体的几何参数进行精细化调整。这种混合几何基元的设定不仅相较于单一类型几何基元提供了更精确的物体检测信号,还为最终的三维布局提供了过完备的约束条件,因而使模型能够有效容忍预测几何基元中的异常值。在包含真实三维扫描数据的两个大规模数据集——ScanNet和SUN RGB-D上,H3DNet均取得了当前最优的三维物体检测性能。

代码仓库

zaiweizhang/H3DNet
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
3d-object-detection-on-arkitscenesH3DNet
mAP@0.25: 38.3
3d-object-detection-on-scannetv2H3DNet
mAP@0.25: 67.2
mAP@0.5: 48.1
3d-object-detection-on-sun-rgbd-valH3DNet
mAP@0.25: 60.1
mAP@0.5: 39.0

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
H3DNet:基于混合几何基元的3D目标检测 | 论文 | HyperAI超神经