4 个月前

NetTailor:调整架构,而不仅仅是权重

NetTailor:调整架构,而不仅仅是权重

摘要

现实世界中的物体识别应用通常需要在一个平台上解决多个任务。在传统的网络微调范式下,每个任务都需要学习一个全新的卷积神经网络(CNN),且最终的网络规模与任务复杂度无关。这种做法是浪费资源的,因为简单任务所需的网络规模比复杂任务小得多,从而限制了可以同时解决的任务数量。为了解决这些问题,我们提出了一种迁移学习方法,称为NetTailor,该方法利用预训练的CNN层作为通用模块,这些模块可以与小型任务特定层结合以生成新的网络。除了最小化分类误差外,新网络还被训练以模仿强大的无约束CNN的内部激活,并通过1)块上的软注意力机制和2)复杂度正则化约束来最小化其复杂度。这样,NetTailor不仅可以调整网络的权重,还可以适应目标任务的网络架构。实验表明,针对字符或交通标志识别等简单任务进行适应的网络显著小于针对细粒度识别等困难任务进行适应的网络。更重要的是,由于该方法具有模块化特性,因此在网络复杂度降低的同时不会影响跨任务参数共享或分类准确性。

代码仓库

pedro-morgado/nettailor
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
continual-learning-on-visual-domain-decathlonNetTailor
Avg. Accuracy: 79.64
decathlon discipline (Score): 3744

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
NetTailor:调整架构,而不仅仅是权重 | 论文 | HyperAI超神经