4 个月前

基于模板的紧凑语义分割架构自动搜索

基于模板的紧凑语义分割架构自动搜索

摘要

自动搜索神经网络架构在各种视觉和自然语言任务中正逐渐成为一种重要的工具,因为它能够在任何感兴趣的数据库上发现高性能的结构。然而,在更复杂的领域(如密集的逐像素分类)中,当前的自动方法在范围上仍存在局限性——由于它们对现有图像分类器的高度依赖,通常只会搜索少数几个额外的层,而发现的架构仍然包含大量的参数。相比之下,本研究提出了一种新颖的解决方案,能够从预训练分类网络中的少量模块出发,找到轻量且准确的分割架构。为此,我们逐步构建了一种方法论,该方法依赖于操作集的模板,预测每个步骤应应用哪个模板以及应用多少次,同时生成连接结构和下采样因子。所有这些决策均由一个循环神经网络做出,该网络根据所生成架构在验证集上的得分进行奖励,并通过强化学习进行训练。其中一个发现的架构在CamVid数据集上达到了63.2%的平均交并比(IoU),在CityScapes数据集上达到了67.8%,而其参数量仅为270K。预训练模型和搜索代码可在以下链接获取:https://github.com/DrSleep/nas-segm-pytorch。

代码仓库

drsleep/nas-segm-pytorch
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
real-time-semantic-segmentation-on-cityscapesTemplate-Based-NAS-arch0
Frame (fps): 19
Time (ms): 52
mIoU: 67.7%
real-time-semantic-segmentation-on-cityscapesTemplate-Based-NAS-arch1
Frame (fps): 10
Time (ms): 97
mIoU: 67.8%
semantic-segmentation-on-camvidTemplate-Based NAS-arch1 (480x360 inputs)
Mean IoU: 63.2%
semantic-segmentation-on-camvidTemplate-Based NAS-arch0 (480x360 inputs)
Mean IoU: 63.9%
semantic-segmentation-on-cityscapesTemplate-Based NAS-arch1
Mean IoU (class): 67.8%
semantic-segmentation-on-cityscapesTemplate-Based NAS-arch0
Mean IoU (class): 67.7%
semantic-segmentation-on-cityscapes-valTemplate-Based NAS-arch0
mIoU: 68.1%
semantic-segmentation-on-cityscapes-valTemplate-Based NAS-arch1
mIoU: 69.5%

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于模板的紧凑语义分割架构自动搜索 | 论文 | HyperAI超神经