3 个月前

用于密集无监督学习的密集孪生网络

用于密集无监督学习的密集孪生网络

摘要

本文提出了一种名为Dense Siamese Network(DenseSiam)的简单无监督学习框架,用于密集预测任务。该框架通过最大化同一图像两个视图之间的相似性来学习视觉表征,引入了两种一致性约束:像素级一致性与区域级一致性。具体而言,DenseSiam首先在重叠区域中基于精确的像素位置对应关系,最大化像素级别的空间一致性;同时,从重叠区域中提取一批区域嵌入(region embeddings),用于对比以实现区域级一致性。与以往方法依赖负样本像素对、动量编码器或启发式掩码不同,DenseSiam仅采用简洁的Siamese网络结构,并有效优化了不同粒度的一致性。实验表明,仅依赖精确的位置对应关系与交互式区域嵌入,已足以有效学习图像间的相似性。我们在ImageNet上对DenseSiam进行了验证,在多个下游任务中取得了具有竞争力的性能提升。此外,仅需引入少量特定任务的损失函数,该简洁框架即可直接应用于密集预测任务。在现有的无监督语义分割基准上,DenseSiam在仅消耗28%训练成本的情况下,取得了比当前最优方法高出2.1 mIoU的性能。相关代码与模型已开源,地址为:https://github.com/ZwwWayne/DenseSiam。

代码仓库

zwwwayne/densesiam
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
unsupervised-semantic-segmentation-on-coco-5DenseSiam
mIoU: 16.4

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
用于密集无监督学习的密集孪生网络 | 论文 | HyperAI超神经