3 个月前

面向几何感知的梯度神经架构搜索算法

面向几何感知的梯度神经架构搜索算法

摘要

近年来,神经架构搜索(Neural Architecture Search, NAS)的前沿方法通过将问题松弛为架构与共享权重的连续优化,采用基于梯度的优化策略,然而这一过程具有噪声性,其内在机制仍缺乏充分理解。本文主张通过研究单层级的经验风险最小化(empirical risk minimization)来深入理解带权重共享的NAS,从而将NAS方法的设计简化为设计能够快速获得高质量解的优化器与正则化策略。基于镜像下降(mirror descent)理论,我们提出一种几何感知框架,充分利用该优化问题的内在结构,从而得到稀疏的架构参数,进而导出一系列简洁而新颖的算法。这些算法具备快速收敛的理论保证,并在最新的计算机视觉NAS基准测试中取得了当前最优的精度表现。值得注意的是,我们在DARTS搜索空间和NAS-Bench201两个基准上,均超越了现有文献报道的最佳结果;尤其在NAS-Bench201上,于CIFAR-10和CIFAR-100数据集上实现了接近“oracle最优”的性能。综上,我们的理论分析与实验结果共同展示了一种系统化的方法,用于协同设计优化器与离散NAS搜索空间的连续松弛方案。

代码仓库

liamcli/gaea_release
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
neural-architecture-search-on-imagenetGAEA PC-DARTS
Params: 5.6
Top-1 Error Rate: 24
neural-architecture-search-on-nas-bench-201GAEA DARTS (ERM)
Accuracy (Test): 46.36
neural-architecture-search-on-nas-bench-201-1GAEA DARTS (ERM)
Accuracy (Test): 94.1
neural-architecture-search-on-nas-bench-201-2GAEA DARTS (ERM)
Accuracy (Test): 73.43

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
面向几何感知的梯度神经架构搜索算法 | 论文 | HyperAI超神经