3 个月前

基于自评估模板网络的一次性神经架构搜索

基于自评估模板网络的一次性神经架构搜索

摘要

神经架构搜索(Neural Architecture Search, NAS)旨在自动化架构搜索过程,取代传统的人工设计方式。尽管近年来的NAS方法已能在数日内完成搜索,但针对每个候选架构仍需进行长时间训练,以获取其参数并准确评估性能。为此,近期提出的一次性NAS(one-shot NAS)方法通过在候选架构间共享参数,大幅压缩了耗时的训练过程:候选架构的参数可直接从共享参数中提取,而无需从头训练。然而,这类方法在评估前无法预判各候选架构的性能优劣,因此通常采用随机采样方式选择待评估候选,最终仅将表现最好的单一候选视为最优结果。本文提出一种自评估模板网络(Self-Evaluated Template Network, SETN),旨在提升待评估候选架构的质量,从而更有可能覆盖具有竞争力的架构。SETN由两个核心组件构成:(1)评估器(evaluator),其学习预测每个独立架构具有较低验证损失的概率,从而实现基于评估器结果的有选择性采样;(2)模板网络(template network),在所有候选架构之间共享参数,以分摊生成候选架构的训练开销。实验结果表明,SETN所发现的架构在CIFAR与ImageNet基准测试上均达到了当前最优性能,且计算成本与现有方法相当。相关代码已公开于GitHub:https://github.com/D-X-Y/AutoDL-Projects。

代码仓库

xxlya/COS598D_Assignment1
pytorch
GitHub 中提及
D-X-Y/AutoDL-Projects
官方
pytorch
GitHub 中提及
D-X-Y/GDAS
pytorch
GitHub 中提及
D-X-Y/NAS-Projects
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
neural-architecture-search-on-cifar-10SETN (T=1K) + CutOut
Search Time (GPU days): 1.8
Top-1 Error Rate: 2.69%
neural-architecture-search-on-nas-bench-201SETN
Accuracy (Val): 32.52
neural-architecture-search-on-nas-bench-201-2SETN
Accuracy (Test): 56.87
Accuracy (Val): 59.05
Search time (s): 31010

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于自评估模板网络的一次性神经架构搜索 | 论文 | HyperAI超神经