3 个月前

基于蒙特卡洛树搜索中动作空间学习的高效样本神经架构搜索

基于蒙特卡洛树搜索中动作空间学习的高效样本神经架构搜索

摘要

神经架构搜索(Neural Architecture Search, NAS)已成为自动神经网络设计的一项有前景的技术。然而,现有的基于蒙特卡洛树搜索(MCTS)的NAS方法通常依赖于人工设计的动作空间(action space),而该动作空间与需优化的性能指标(如准确率)并无直接关联,导致架构探索过程样本效率低下。为提升样本效率,本文提出了一种新的方法——潜在动作神经架构搜索(Latent Action Neural Architecture Search, LaNAS),该方法通过学习一系列动作,递归地将搜索空间划分为性能表现良好或较差的区域,其中每个区域内的网络具有相似的性能指标。在搜索阶段,由于不同的动作序列会导向不同性能水平的区域,通过优先探索表现良好的区域,可显著提升搜索效率。在三个NAS任务上的实验结果表明,LaNAS的样本效率至少比基线方法(包括进化算法、贝叶斯优化和随机搜索)高出一个数量级。在实际应用中,无论是单次训练(one-shot)版本还是常规版本的LaNAS,均持续优于现有方法。特别地,LaNAS仅用800个样本便在CIFAR-10上实现了99.0%的准确率,在ImageNet上以600 MFLOPS的计算量达到了80.8%的Top-1准确率,显著超越AmoebaNet,且仅需其约1/33的样本数量。

基准测试

基准方法指标
image-classification-on-cifar-10LaNet
Percentage correct: 99.03

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供