4 个月前

基于深度密度的图像聚类

基于深度密度的图像聚类

摘要

近日,通过深度神经网络进行有利于聚类任务的特征学习的深度聚类方法在图像聚类应用中取得了显著的性能提升。然而,现有的深度聚类算法通常需要预先指定聚类的数量,而在实际任务中这一数量往往是未知的。此外,所学习特征空间中的初始聚类中心是由$k$-均值(k-means)生成的,这种方法仅对球形聚类效果较好,可能会导致聚类结果不稳定。本文提出了一种两阶段的基于密度的深度图像聚类(DDC)框架来解决这些问题。第一阶段是训练一个深度卷积自编码器(CAE),从高维图像数据中提取低维特征表示,然后应用t-SNE进一步将数据降维至二维空间,以利于基于密度的聚类算法的应用。第二阶段是在二维嵌入数据上应用开发的基于密度的聚类技术,自动识别具有任意形状的适当数量的聚类。具体而言,生成多个局部聚类以捕捉集群的局部结构,然后通过它们之间的密度关系进行合并,形成最终的聚类结果。实验表明,所提出的DDC框架在未给出聚类数量的情况下,其聚类性能可与最先进的深度聚类方法相媲美甚至更优。

代码仓库

基准测试

基准方法指标
image-clustering-on-fashion-mnistDDC
Accuracy: 0.619
NMI: 0.682
image-clustering-on-fashion-mnistDDC-DA
Accuracy: 0.609
NMI: 0.661
image-clustering-on-lettera-jDDC-DA
Accuracy: 0.691
NMI: 0.629
image-clustering-on-lettera-jDDC
Accuracy: 0.573
NMI: 0.546
image-clustering-on-mnist-fullDDC-DA
Accuracy: 0.986
NMI: 0.961
image-clustering-on-mnist-testDDC
Accuracy: 0.965
NMI: 0.916
image-clustering-on-mnist-testDDC-DA
Accuracy: 0.97
NMI: 0.927
image-clustering-on-uspsDDC-DA
Accuracy: 0.977
NMI: 0.939
image-clustering-on-uspsDDC
Accuracy: 0.967
NMI: 0.918

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于深度密度的图像聚类 | 论文 | HyperAI超神经