3 个月前

基于回归的通用神经架构搜索

基于回归的通用神经架构搜索

摘要

现有的大多数神经架构搜索(Neural Architecture Search, NAS)算法均针对特定下游任务进行设计与评估,例如计算机视觉中的图像分类任务。然而,大量实验表明,诸如计算机视觉中的ResNet和自然语言处理中的LSTM等杰出神经架构,通常具备强大的输入数据模式提取能力,并能在多种不同的下游任务上表现出色。本文旨在探讨与NAS相关的两个根本性问题:(1)是否必须依赖特定下游任务的性能来评估并搜索优质神经架构?(2)我们能否在不依赖下游任务的前提下,实现高效且有效的NAS?为回答上述问题,本文提出一种新颖且通用的NAS框架,称为通用神经架构搜索(Generic NAS, GenNAS)。GenNAS不依赖任务特定的标签,而是通过在一组人工设计的合成信号基函数上进行回归任务来评估架构性能。该自监督回归任务能够有效衡量架构捕捉与转换输入信号模式的内在能力,并支持训练样本的更充分使用。在13个CNN搜索空间和1个自然语言处理(NLP)搜索空间上的大量实验表明,GenNAS在回归评估方面表现出卓越效率,具体体现在两个维度:其一,架构评估的准确性(通过近似性能与下游任务性能之间的斯皮尔曼等级相关系数Spearman's rho衡量);其二,训练收敛速度极快,通常在数秒内即可完成。

代码仓库

leeyeehoo/GenNAS
官方
pytorch
GitHub 中提及
leeyeehoo/gennas-zero
pytorch
GitHub 中提及

基准测试

基准方法指标
neural-architecture-search-on-nas-bench-101GenNAS
Spearman Correlation: 0.87
neural-architecture-search-on-nas-bench-201GenNAS
Accuracy (Test): 45.59
Search time (s): 1080
neural-architecture-search-on-nas-bench-201-1GenNAS
Accuracy (Test): 94.18
Accuracy (Val): -
Search time (s): 1080
neural-architecture-search-on-nas-bench-201-2GenNAS
Accuracy (Test): 72.56
Search time (s): 1080

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于回归的通用神经架构搜索 | 论文 | HyperAI超神经