8 个月前

计算机视觉

计算机视觉

Yunfan Li Mouxing Yang Dezhong Peng Taihao Li Jiantao Huang Xi Peng

摘要

本文提出了一种通过在实例级和聚类级进行双对比学习（Twin Contrastive Learning, TCL）来实现在线聚类的方法。具体而言，我们发现当数据被投影到目标聚类数维度的特征空间时，其特征矩阵的行和列分别对应于实例表示和聚类表示。基于这一观察，对于给定的数据集，所提出的TCL首先通过数据增强构建正样本对和负样本对。随后，在特征矩阵的行空间和列空间中，分别通过拉近正样本对并推开负样本对来进行实例级和聚类级的对比学习。为了减轻固有假负样本对的影响并修正聚类分配，我们采用了一种基于置信度的标准来选择伪标签，以增强实例级和聚类级的对比学习效果。因此，聚类性能得到了进一步提升。除了双对比学习这一优雅的思想外，TCL的另一个优势在于它可以独立地预测每个实例的聚类分配，从而轻松适应在线场景。在六个广泛使用的图像和文本基准数据集上进行的大量实验验证了TCL的有效性。代码将在GitHub上发布。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

8 个月前

计算机视觉

计算机视觉

Yunfan Li Mouxing Yang Dezhong Peng Taihao Li Jiantao Huang Xi Peng

摘要

本文提出了一种通过在实例级和聚类级进行双对比学习（Twin Contrastive Learning, TCL）来实现在线聚类的方法。具体而言，我们发现当数据被投影到目标聚类数维度的特征空间时，其特征矩阵的行和列分别对应于实例表示和聚类表示。基于这一观察，对于给定的数据集，所提出的TCL首先通过数据增强构建正样本对和负样本对。随后，在特征矩阵的行空间和列空间中，分别通过拉近正样本对并推开负样本对来进行实例级和聚类级的对比学习。为了减轻固有假负样本对的影响并修正聚类分配，我们采用了一种基于置信度的标准来选择伪标签，以增强实例级和聚类级的对比学习效果。因此，聚类性能得到了进一步提升。除了双对比学习这一优雅的思想外，TCL的另一个优势在于它可以独立地预测每个实例的聚类分配，从而轻松适应在线场景。在六个广泛使用的图像和文本基准数据集上进行的大量实验验证了TCL的有效性。代码将在GitHub上发布。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供