
摘要
为深度神经网络训练数据进行标注是一项艰巨且繁琐的任务,需要数百万个标签才能达到当前最先进水平的结果。通过利用无监督学习技术提取层次特征,可以减少对大量标注数据的依赖。在本研究中,我们提出了一种基于增强版k均值聚类算法的深度卷积网络训练方法,该方法减少了形式相似的滤波器之间的相关参数数量,从而提高了测试分类的准确性。我们将该算法称为卷积k均值聚类(Convolutional k-means Clustering)。此外,我们还证明了学习深度卷积神经网络各层之间的连接关系可以提高其在少量标注数据上进行训练的能力。实验结果表明,所提出的算法优于其他无监督学习滤波器的技术。具体而言,我们在STL-10数据集上获得了74.1%的测试准确率,在MNIST数据集上达到了0.5%的测试错误率。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| image-classification-on-mnist | Convolutional Clustering | Percentage error: 1.4 |
| image-classification-on-stl-10 | Convolutional Clustering | Percentage correct: 74.1 |