4 个月前

使用非对称注释的实时联合语义分割和深度估计

使用非对称注释的实时联合语义分割和深度估计

摘要

在机器人中部署深度学习模型作为感知信息提取器是一项艰巨的任务,即使使用通用的GPU卡也是如此。本文旨在解决其中三个最突出的问题,即:i)使单一模型能够同时执行多个任务(在本研究中,我们考虑深度估计和语义分割对于获取场景的几何和语义理解至关重要),ii)实现实时处理,以及iii)使用具有不同模态注释数量不对称的数据集。为了解决前两个问题,我们对最近提出的一种实时语义分割网络进行了改进,进一步减少了浮点运算的数量。针对第三个问题,我们在假设可以访问到一个强大的“教师”网络的前提下,采用了一种基于硬知识蒸馏的简单解决方案。我们展示了如何轻松扩展我们的系统以同时处理更多任务和更多数据集,并且使用单个模型即可在室内和室外环境中进行深度估计和分割。定量结果显示,我们的方法在一次前向传递仅需13毫秒和6.5 GFLOPs的情况下,达到了与当前最先进的方法相当或更好的性能(输入分辨率为640x480)。这种高效性使我们可以直接将网络的原始预测结果集成到SemanticFusion框架中,用于场景的密集3D语义重建。

基准测试

基准方法指标
monocular-depth-estimation-on-nyu-depth-v2Multi-Task Light-Weight-RefineNet
RMSE: 0.565
real-time-semantic-segmentation-on-nyu-depth-1Multi-Task Light-Weight-RefineNet
Speed(ms/f): 13
mIoU: 42.0
semantic-segmentation-on-nyu-depth-v2Multi-Task Light-Weight-RefineNet
Mean IoU: 42.0%

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
使用非对称注释的实时联合语义分割和深度估计 | 论文 | HyperAI超神经