8 个月前

多任务学习

计算机视觉

Kim Curie ; Kim Ue-Hwan

摘要

鸟瞰图（BEV）表示方法使得自动驾驶中的多个任务，如道路布局估计和三维物体检测，能够进行稳健的学习。然而，当前用于统一道路布局估计和三维物体检测的方法很少处理训练数据集中的类别不平衡问题以及多类别学习，以减少所需网络的总数。为了解决这些问题，我们提出了一种基于 Transformer 架构和CycleGAN学习框架的统一模型，用于道路布局估计和三维物体检测。该模型利用焦点损失（focal loss）和提出的双循环损失（dual cycle loss）来应对数据集类别不平衡导致的性能下降问题。此外，我们设置了广泛的学习场景，以研究在不同情况下多类别学习对道路布局估计的影响。为了验证所提模型及学习方案的有效性，我们进行了详尽的消融实验和对比实验。实验结果证明了我们模型的有效性；我们在道路布局估计和三维物体检测任务中均达到了最先进的性能。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

8 个月前

多任务学习

计算机视觉

Kim Curie ; Kim Ue-Hwan

摘要

鸟瞰图（BEV）表示方法使得自动驾驶中的多个任务，如道路布局估计和三维物体检测，能够进行稳健的学习。然而，当前用于统一道路布局估计和三维物体检测的方法很少处理训练数据集中的类别不平衡问题以及多类别学习，以减少所需网络的总数。为了解决这些问题，我们提出了一种基于 Transformer 架构和CycleGAN学习框架的统一模型，用于道路布局估计和三维物体检测。该模型利用焦点损失（focal loss）和提出的双循环损失（dual cycle loss）来应对数据集类别不平衡导致的性能下降问题。此外，我们设置了广泛的学习场景，以研究在不同情况下多类别学习对道路布局估计的影响。为了验证所提模型及学习方案的有效性，我们进行了详尽的消融实验和对比实验。实验结果证明了我们模型的有效性；我们在道路布局估计和三维物体检测任务中均达到了最先进的性能。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

一种双循环跨视角变换器网络用于统一的鸟瞰图道路布局估计和3D目标检测 | 论文 | HyperAI超神经