4 个月前

基于相机的语义场景补全的层次时间上下文学习

基于相机的语义场景补全的层次时间上下文学习

摘要

基于相机的三维语义场景补全(SSC)在仅使用有限的二维图像观测预测复杂三维布局方面具有关键作用。现有的主流解决方案通常通过粗略堆叠历史帧来补充当前帧,以利用时间信息,但这种直接的时间建模方法不可避免地会削弱有效线索并增加学习难度。为了解决这一问题,我们提出了一种新的层次时间上下文学习范式——HTCL,用于改进基于相机的语义场景补全。本工作的主要创新点在于将时间上下文学习分解为两个层次步骤:(a) 跨帧亲和度测量和 (b) 基于亲和度的动态精炼。首先,为了从冗余信息中分离出关键的相关上下文,我们引入了具有尺度感知隔离和多个独立学习器的模式亲和度,以实现细粒度的上下文对应建模。随后,为了动态补偿不完整的观测数据,我们根据初始识别出的高亲和度位置及其邻近相关区域自适应地调整特征采样位置。我们的方法在SemanticKITTI基准测试中排名第一,并且在OpenOccupancy基准测试中的mIoU指标上甚至超过了基于LiDAR的方法。我们的代码已发布在 https://github.com/Arlo0o/HTCL。

代码仓库

arlo0o/htcl
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
3d-semantic-scene-completion-on-semantickittiHTCL-S
mIoU: 17.09

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于相机的语义场景补全的层次时间上下文学习 | 论文 | HyperAI超神经