
摘要
针对特定任务的神经网络架构自动化设计是一条极具前景但本质上具有挑战性的研究路径。尽管该领域的大多数成果集中在图像分类和语言模型问题上,本文则专注于密集的逐像素任务,特别是使用全卷积网络进行语义图像分割。与上述领域不同,全卷积网络的设计选择需要进行多项调整,从所需使用的操作类型(例如,空洞卷积)到解决更为复杂的优化问题。在本工作中,我们特别关注搜索高性能紧凑型分割架构,这些架构能够在资源有限的情况下实现实时运行。为此,我们在训练过程中有意对架构进行了过度参数化,通过一组辅助单元提供中间监督信号,并在评估阶段可以省略这些辅助单元。辅助单元的设计由控制器生成,这是一个使用强化学习训练的固定结构神经网络。更重要的是,我们展示了如何在有限的时间和计算预算内高效地搜索这些架构。具体而言,我们依赖于一种逐步策略来终止那些没有潜力的架构继续训练,并结合Polyak平均法和知识蒸馏技术以加速收敛过程。定量结果显示,在8个GPU天内,我们的方法发现了一组在紧凑模型中与现有最先进方法相当的架构,在语义分割、姿态估计和深度预测任务上表现出色。代码将在以下地址公开:https://github.com/drsleep/nas-segm-pytorch
代码仓库
drsleep/nas-segm-pytorch
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| monocular-depth-estimation-on-nyu-depth-v2 | FastDenseNas-arch1 | RMSE: 0.526 |
| monocular-depth-estimation-on-nyu-depth-v2 | FastDenseNas-arch0 | RMSE: 0.523 |
| monocular-depth-estimation-on-nyu-depth-v2 | FastDenseNas-arch2 | RMSE: 0.525 |
| semantic-segmentation-on-pascal-voc-2012-val | FastDenseNas-arch1 | mIoU: 77.1% |
| semantic-segmentation-on-pascal-voc-2012-val | FastDenseNas-arch2 | mIoU: 77.3% |
| semantic-segmentation-on-pascal-voc-2012-val | FastDenseNas-arch0 | mIoU: 78.0% |