4 个月前

PointBeV:一种稀疏的BeV预测方法

PointBeV:一种稀疏的BeV预测方法

摘要

鸟瞰图(BeV)表示已成为驾驶应用中的事实共享空间,为传感器数据融合提供了一个统一的空间,并支持各种下游任务。然而,传统的模型使用固定分辨率和范围的网格,在所有单元格中均匀分配资源导致计算效率低下。为了解决这一问题,我们提出了一种新的稀疏BeV分割模型——PointBeV,该模型在稀疏BeV单元上运行,而不是在密集的网格上。这种方法提供了对内存使用的精确控制,使得可以使用长时间上下文,并适应内存受限的平台。PointBeV采用高效的两阶段训练策略,能够在感兴趣区域进行集中计算。在推理时,它可以用于不同的内存/性能权衡,并灵活调整以适应新的特定应用场景。尽管仅使用稀疏信号进行训练,PointBeV在nuScenes数据集上的车辆、行人和车道分割任务中仍取得了最先进的结果,在静态和时间设置下表现出色。我们将发布我们的代码以及架构中使用的两个新高效模块:稀疏特征提取(Sparse Feature Pulling),旨在从图像到BeV有效提取特征;子流形注意力机制(Submanifold Attention),能够实现高效的时间建模。我们的代码可在 https://github.com/valeoai/PointBeV 获取。

代码仓库

valeoai/pointbev
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
bird-s-eye-view-semantic-segmentation-onPointBeV (static)
IoU lane - 224x480 - 100x100 at 0.5: 49.6
IoU ped - 224x480 - Vis filter. - 100x100 at 0.5: 18.5
IoU veh - 224x480 - No vis filter - 100x100 at 0.5: 38.7
IoU veh - 224x480 - Vis filter. - 100x100 at 0.5: 44.0
IoU veh - 448x800 - No vis filter - 100x100 at 0.5: 42.1
IoU veh - 448x800 - Vis filter. - 100x100 at 0.5: 47.6
bird-s-eye-view-semantic-segmentation-onPointBeV
IoU ped - 224x480 - Vis filter. - 100x100 at 0.5: 19.9
IoU veh - 224x480 - No vis filter - 100x100 at 0.5: 39.9
IoU veh - 224x480 - Vis filter. - 100x100 at 0.5: 44.7
IoU veh - 448x800 - No vis filter - 100x100 at 0.5: 43.2
IoU veh - 448x800 - Vis filter. - 100x100 at 0.5: 48.7
bird-s-eye-view-semantic-segmentation-on-lyftPointBeV (ResNet-50)
IoU vehicle - 224x480 - Long: 44.5
IoU vehicle - 224x480 - Short: 72.3
bird-s-eye-view-semantic-segmentation-on-lyftPointBeV (EfficientNet-b4)
IoU vehicle - 224x480 - Long: 45.4
IoU vehicle - 224x480 - Short: 72.6

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
PointBeV:一种稀疏的BeV预测方法 | 论文 | HyperAI超神经