4 个月前

基于隐式3D方向学习的RGB图像6D物体检测

基于隐式3D方向学习的RGB图像6D物体检测

摘要

我们提出了一种基于实时RGB的物体检测和6D姿态估计管道。我们的新颖3D方向估计方法基于一种变体的去噪自编码器(Denoising Autoencoder),该自编码器通过域随机化(Domain Randomization)在3D模型的模拟视图上进行训练。这种所谓的增强自编码器(Augmented Autoencoder)相比现有方法具有多个优势:它不需要真实且带有姿态注释的训练数据,能够泛化到不同的测试传感器,并且能够内在地处理物体和视角对称性。该方法不是学习从输入图像到物体姿态的显式映射,而是提供了一个由潜在空间中的样本定义的物体方向的隐式表示。我们的管道在T-LESS数据集上实现了RGB和RGB-D领域的最先进性能。我们还在LineMOD数据集上进行了评估,其结果可以与其他合成训练的方法相媲美。通过校正3D方向估计以补偿物体偏离图像中心时产生的透视误差,我们进一步提高了性能,并展示了扩展的结果。

代码仓库

DLR-RM/AugmentedAutoencoder
官方
tf
GitHub 中提及

基准测试

基准方法指标
6d-pose-estimation-on-linemodAugmented Autoencoder
Mean ADD: 28.7
6d-pose-estimation-on-t-lessAugmented Autoencoder
Mean Recall: 36.8
6d-pose-estimation-using-rgbd-on-linemodAugmented Autoencoder
Mean ADD: 64.67
6d-pose-estimation-using-rgbd-on-t-lessAugmented Autoencoder
Mean Recall: 72.76

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于隐式3D方向学习的RGB图像6D物体检测 | 论文 | HyperAI超神经