3 个月前

基于投影到正交补空间的散射变换图像聚类

基于投影到正交补空间的散射变换图像聚类

摘要

近年来,图像聚类技术取得了显著进步,主要得益于深度学习领域的快速发展。然而,由于深度神经网络架构的复杂性,目前尚缺乏能够从数学理论上解释深度聚类方法成功原因的理论体系。在本研究中,我们提出了一种先进的、稳定且高效的图像聚类算法——投影散射谱聚类(Projected-Scattering Spectral Clustering, PSSC),该方法不仅具备出色的性能,还具有良好的数学可解释性。PSSC引入了一种新颖的方法,用于挖掘小尺寸图像在散射变换(scattering transform)域中的几何结构特性。这一方法的灵感来源于一个关键观察:在散射变换域中,各个类别数据矩阵对应于前几个最大特征值的特征向量所张成的子空间,在不同类别之间具有高度相似性。因此,通过将这些共享子空间进行投影去除,可以显著降低类内差异性,从而大幅提升聚类效果。我们称此方法为“正交补空间投影”(Projection onto Orthogonal Complement, POC)。实验结果表明,PSSC在所有浅层聚类算法中均取得了最优性能;同时,其聚类效果与当前最先进的聚类技术相当,但执行时间却减少了超过一个数量级。秉承可复现研究(reproducible research)的理念,我们随论文一并发布了高质量的代码仓库,以促进学术交流与进一步研究。

代码仓库

vmorgenshtern/scattering-clustering
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
image-clustering-on-fashion-mnistPSSC
Accuracy: 0.628
NMI: 0.644
image-clustering-on-mnist-fullPSSC
Accuracy: 0.964
NMI: 0.921
image-clustering-on-mnist-testPSSC
Accuracy: 0.967
NMI: 0.919
image-clustering-on-uspsPSSC
Accuracy: 0.957
NMI: 0.898

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于投影到正交补空间的散射变换图像聚类 | 论文 | HyperAI超神经