8 个月前

机器视觉 3D

卷积神经网络

计算机视觉

Qiu Rui ; Xu Ming ; Yan Yuyao ; Smith Jeremy S. ; Yang Xi

摘要

尽管基于深度学习的单目行人检测方法已经取得了显著进展，但它们在面对严重遮挡时仍然表现脆弱。利用多视图信息融合是一种潜在的解决方案，但由于现有多视图数据集中缺乏标注的训练样本，这种方法的应用范围受到了限制，增加了过拟合的风险。为了解决这一问题，提出了一种数据增强方法，该方法通过在地面上随机生成平均尺寸与行人相当的3D圆柱形遮挡物，并将其投影到多个视图中，以减轻训练过程中的过拟合影响。此外，每个视图的特征图通过使用同胚变换（homographies）被投影到不同高度的多个平行平面上，这使得卷积神经网络（CNNs）能够充分利用每个行人在高度方向上的特征来推断其在地面平面的位置。所提出的3DROM方法在性能上相比现有的最先进的多视图行人检测深度学习方法有了显著提升。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

8 个月前

机器视觉 3D

卷积神经网络

计算机视觉

Qiu Rui ; Xu Ming ; Yan Yuyao ; Smith Jeremy S. ; Yang Xi

摘要

尽管基于深度学习的单目行人检测方法已经取得了显著进展，但它们在面对严重遮挡时仍然表现脆弱。利用多视图信息融合是一种潜在的解决方案，但由于现有多视图数据集中缺乏标注的训练样本，这种方法的应用范围受到了限制，增加了过拟合的风险。为了解决这一问题，提出了一种数据增强方法，该方法通过在地面上随机生成平均尺寸与行人相当的3D圆柱形遮挡物，并将其投影到多个视图中，以减轻训练过程中的过拟合影响。此外，每个视图的特征图通过使用同胚变换（homographies）被投影到不同高度的多个平行平面上，这使得卷积神经网络（CNNs）能够充分利用每个行人在高度方向上的特征来推断其在地面平面的位置。所提出的3DROM方法在性能上相比现有的最先进的多视图行人检测深度学习方法有了显著提升。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供