4 个月前

基于辅助单元的紧凑语义分割模型快速神经架构搜索

基于辅助单元的紧凑语义分割模型快速神经架构搜索

摘要

针对特定任务的神经网络架构自动化设计是一条极具前景但本质上具有挑战性的研究路径。尽管该领域的大多数成果集中在图像分类和语言模型问题上,本文则专注于密集的逐像素任务,特别是使用全卷积网络进行语义图像分割。与上述领域不同,全卷积网络的设计选择需要进行多项调整,从所需使用的操作类型(例如,空洞卷积)到解决更为复杂的优化问题。在本工作中,我们特别关注搜索高性能紧凑型分割架构,这些架构能够在资源有限的情况下实现实时运行。为此,我们在训练过程中有意对架构进行了过度参数化,通过一组辅助单元提供中间监督信号,并在评估阶段可以省略这些辅助单元。辅助单元的设计由控制器生成,这是一个使用强化学习训练的固定结构神经网络。更重要的是,我们展示了如何在有限的时间和计算预算内高效地搜索这些架构。具体而言,我们依赖于一种逐步策略来终止那些没有潜力的架构继续训练,并结合Polyak平均法和知识蒸馏技术以加速收敛过程。定量结果显示,在8个GPU天内,我们的方法发现了一组在紧凑模型中与现有最先进方法相当的架构,在语义分割、姿态估计和深度预测任务上表现出色。代码将在以下地址公开:https://github.com/drsleep/nas-segm-pytorch

基准测试

基准方法指标
monocular-depth-estimation-on-nyu-depth-v2FastDenseNas-arch1
RMSE: 0.526
monocular-depth-estimation-on-nyu-depth-v2FastDenseNas-arch0
RMSE: 0.523
monocular-depth-estimation-on-nyu-depth-v2FastDenseNas-arch2
RMSE: 0.525
semantic-segmentation-on-pascal-voc-2012-valFastDenseNas-arch1
mIoU: 77.1%
semantic-segmentation-on-pascal-voc-2012-valFastDenseNas-arch2
mIoU: 77.3%
semantic-segmentation-on-pascal-voc-2012-valFastDenseNas-arch0
mIoU: 78.0%

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于辅助单元的紧凑语义分割模型快速神经架构搜索 | 论文 | HyperAI超神经