
摘要
在终身学习中,学习者会面对一系列任务,逐步构建一个数据驱动的先验知识,该先验知识可以用于加速新任务的学习。在这项研究中,我们从样本复杂度、计算成本和内存成本三个方面调查了当前终身学习方法的效率。为此,我们首先引入了一种新的、更为现实的评估协议,即学习者每次仅观察每个示例一次,并且超参数选择是在一个小的、独立的任务集上进行的,该任务集不用于实际的学习体验和评估。其次,我们提出了一种新的指标来衡量学习者获取新技能的速度。第三,我们提出了GEM(Lopez-Paz & Ranzato, 2017)的一个改进版本,称为平均GEM(A-GEM),其性能与GEM相同甚至更好,同时在计算和内存效率方面几乎与EWC(Kirkpatrick et al., 2016)和其他基于正则化的算法相当。最后,我们展示了如果提供描述所考虑分类任务的任务描述符,则所有算法包括A-GEM都可以更快地学习。我们在多个标准终身学习基准上的实验表明,A-GEM在准确性和效率之间具有最佳的平衡。
代码仓库
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| class-incremental-learning-on-cifar100 | A-GEM | 10-stage average accuracy: 45.76 |
| continual-learning-on-asc-19-tasks | A-GEM | F1 - macro: 0.7844 |