
摘要
在无监督学习中,没有一个显而易见的成本函数能够捕捉到变化和相似性的关键因素。由于自然系统具有平滑的动力学特性,如果无监督目标函数在整个训练过程中保持静态,则会错失机会。缺乏明确的监督意味着应该将平滑动力学特性整合进来。与传统的静态成本函数相比,动态目标函数可以更好地利用通过伪监督获得的渐进且不确定的知识。本文提出了一种新的模型——动态自编码器(DynAE),该模型通过逐渐且平滑地消除重建目标函数,转而支持聚类目标函数,从而克服了聚类与重建之间的权衡问题。基准数据集上的实验评估表明,我们的方法在与最相关的深度聚类方法相比时,达到了最先进的结果。
代码仓库
nairouz/DynAE
官方
tf
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| image-clustering-on-fashion-mnist | DynAE | Accuracy: 0.591 NMI: 0.642 |
| image-clustering-on-mnist-full | DynAE | Accuracy: 0.987 NMI: 0.964 |
| image-clustering-on-mnist-test | DynAE | Accuracy: 0.987 NMI: 0.963 |
| image-clustering-on-usps | DynAE | Accuracy: 0.981 NMI: 0.948 |