
摘要
实时场景理解在许多应用中变得至关重要,例如自动驾驶。本文提出了一种称为BlitzNet的深度架构,该架构能够在一次前向传递中同时执行目标检测和语义分割,从而实现实时计算。除了通过单一网络完成多个任务所带来的计算效率提升外,我们还展示了目标检测和语义分割在准确性方面可以互相受益。针对VOC和COCO数据集的实验结果表明,BlitzNet在实时系统中的目标检测和分割性能达到了当前最佳水平。
代码仓库
dvornikita/blitznet
tf
GitHub 中提及
ShunyuYao/blitznet_instance_segment
tf
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| object-detection-on-pascal-voc-2007 | BlitzNet512 + seg (s8) | MAP: 81.5% |
| real-time-object-detection-on-pascal-voc-2007 | BlitzNet512 (s4) | FPS: 24 MAP: 79.1% |
| real-time-object-detection-on-pascal-voc-2007 | BlitzNet512 (s8) | FPS: 19.5 MAP: 81.5% |