3 个月前

用于高效降维的分层最近邻图嵌入

用于高效降维的分层最近邻图嵌入

摘要

降维在数据可视化以及机器学习中的高维数据预处理中均具有关键作用。本文提出一种新方法,该方法基于原始空间中构建的1-最近邻图(1-nearest neighbor graphs)所形成的层次结构,旨在多层级上保持数据分布的聚类特性。该方法的核心是一种无需优化的投影机制,在性能和可视化质量方面与最新的t-SNE和UMAP方法相当,同时运行速度高出一个数量级。此外,该方法具备可解释性强、支持新数据投影以及在可视化中自然分离数据簇等优势,使其成为一种通用的无监督降维技术。在论文中,我们论证了该方法的合理性,并在其在包含1K至1100万样本、维度范围为28至16,000的多样化数据集上进行了全面评估。我们在多种指标和目标维度下与现有最先进方法进行了对比,充分展现了其高效性与卓越性能。相关代码已开源,地址为:https://github.com/koulakis/h-nne。

代码仓库

koulakis/h-nne
官方
GitHub 中提及

基准测试

基准方法指标
data-augmentation-on-ga1457hNNE
Classification Accuracy: 77.4

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
用于高效降维的分层最近邻图嵌入 | 论文 | HyperAI超神经