
摘要
一个高效的学习者是指能够利用已有的知识来解决新问题的人。对于机器学习者而言,这意味着理解不同数据集之间的相似性。为了实现这一目标,必须认真对待以数据集而非单个数据点作为建模的关键对象这一理念。为此,我们展示了一种变分自编码器的扩展方法,该方法能够在无监督的情况下学习计算数据集表示(或统计量)的方法。网络被训练生成能够封装每个数据集生成模型的统计量。因此,该网络能够从新的数据集中高效地进行学习,无论是无监督任务还是有监督任务。我们证明了所学的统计量可以用于:对数据集进行聚类、将生成模型迁移到新数据集、选择数据集的代表性样本以及分类以前未见过的类别。我们将这种模型称为神经统计学家(Neural Statistician),即一种能够无监督地学习计算数据集摘要统计量的神经网络。
代码仓库
comramona/neural-statistician
pytorch
GitHub 中提及
htso/Pedestrian_in_few_shots
pytorch
GitHub 中提及
lupalab/flowscan
tf
GitHub 中提及
conormdurkan/neural-statistician
pytorch
GitHub 中提及
cravingoxygen/neuralstat
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| few-shot-image-classification-on-omniglot-1-1 | Neural Statistician | Accuracy: 93.2% |
| few-shot-image-classification-on-omniglot-1-2 | Neural Statistician | Accuracy: 98.1 |
| few-shot-image-classification-on-omniglot-5-1 | Neural Statistician | Accuracy: 98.1% |
| few-shot-image-classification-on-omniglot-5-2 | Neural Statistician | Accuracy: 99.5 |