
摘要
可微分架构搜索(Differentiable Architecture Search, DARTS)是一种基于可微分松弛的近期神经架构搜索(Neural Architecture Search, NAS)方法。由于其出色的表现,近年来涌现出大量针对DARTS框架中各个组成部分进行分析与改进的变体。本文将该问题建模为一个约束型双层优化问题,提出并分析了DARTS-PRIME这一新变体,其在架构权重更新调度策略及离散化正则化方面引入了改进。我们提出一种基于每个小批量(minibatch)网络信息的动态更新调度机制,使架构更新更具信息性;同时引入邻近性正则化(proximity regularization),以促进架构在离散化过程中的良好分离。在多个应用领域上的实验结果表明,DARTS-PRIME在性能与可靠性方面均显著优于原始DARTS,其表现可与当前最先进的可微分NAS方法相媲美。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| neural-architecture-search-on-cifar-10 | DARTS-PRIME | Parameters: 3.7M Search Time (GPU days): 0.5 Top-1 Error Rate: 2.62% |
| neural-architecture-search-on-cifar-100-1 | DARTS-PRIME | PARAMS: 3.16M Percentage Error: 17.44 |