3 个月前

Shapley-NAS:用于神经架构搜索的操作贡献发现

Shapley-NAS:用于神经架构搜索的操作贡献发现

摘要

本文提出了一种基于Shapley值的神经架构搜索方法(Shapley-NAS),用于评估各操作对模型性能的贡献。可微分神经架构搜索(DARTS)通过梯度下降优化架构参数以获取最优架构,显著降低了搜索成本。然而,梯度下降更新的架构参数大小无法准确反映各操作对任务性能的真实重要性,从而影响所获架构的有效性。与此不同,本文提出直接评估各操作对验证准确率的直接影响。为处理超网络组件之间的复杂依赖关系,我们采用Shapley值来量化其边际贡献,综合考虑所有可能的操作组合。具体而言,我们通过迭代优化超网络权重,并基于Shapley值评估操作贡献来更新架构参数,最终通过选择对任务贡献显著的操作来构建最优架构。由于精确计算Shapley值属于NP难问题,本文采用基于蒙特卡洛采样的近似算法,并引入早期截断机制以提高效率,同时采用动量更新机制以缓解采样过程中的波动问题。在多个数据集和多种搜索空间上的大量实验表明,所提出的Shapley-NAS方法在显著降低搜索成本的前提下,性能优于现有最先进方法。代码已开源,地址为:https://github.com/Euphoria16/Shapley-NAS.git

代码仓库

基准测试

基准方法指标
neural-architecture-search-on-cifar-10Shapley-NAS(best)
Parameters: 3.6M
Top-1 Error Rate: 2.43%
neural-architecture-search-on-imagenetShapley-NAS
MACs: 582M
Params: 5.4M
Top-1 Error Rate: 23.9
neural-architecture-search-on-nas-bench-201Shapley-NAS
Accuracy (Test): 46.85
Accuracy (Val): 46.57
neural-architecture-search-on-nas-bench-201-1Shapley-NAS
Accuracy (Test): 94.37
Accuracy (Val): 91.61
neural-architecture-search-on-nas-bench-201-2Shapley-NAS
Accuracy (Test): 73.51
Accuracy (Val): 73.49

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
Shapley-NAS:用于神经架构搜索的操作贡献发现 | 论文 | HyperAI超神经