6 个月前

计算机视觉

卷积神经网络

计算机视觉

Eu Wern Teh Terrance DeVries Graham W. Taylor

摘要

我们研究了距离度量学习（Distance Metric Learning, DML）问题，其目标是学习图像之间的有效相似性度量。本文重新审视了ProxyNCA方法，并引入多项改进。我们发现，低温度缩放（low temperature scaling）是影响性能的关键组件，并阐明了其有效的原因。此外，我们还发现，在大多数情况下，全局最大池化（Global Max Pooling）的性能优于全局平均池化（Global Average Pooling）。同时，我们提出的快速移动代理（fast moving proxies）机制有效缓解了代理向量梯度过小的问题，且该组件与低温度缩放和全局最大池化具有良好的协同效应。基于上述改进，我们提出的增强模型——ProxyNCA++，在四个不同的零样本图像检索数据集上，Recall@1的平均性能相比原始ProxyNCA算法提升了22.9个百分点。此外，我们在CUB200、Cars196、Sop和InShop数据集上均取得了当前最优（state-of-the-art）的性能，对应的Recall@1得分分别为72.2、90.1、81.4和90.9。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

计算机视觉

卷积神经网络

计算机视觉

Eu Wern Teh Terrance DeVries Graham W. Taylor

摘要

我们研究了距离度量学习（Distance Metric Learning, DML）问题，其目标是学习图像之间的有效相似性度量。本文重新审视了ProxyNCA方法，并引入多项改进。我们发现，低温度缩放（low temperature scaling）是影响性能的关键组件，并阐明了其有效的原因。此外，我们还发现，在大多数情况下，全局最大池化（Global Max Pooling）的性能优于全局平均池化（Global Average Pooling）。同时，我们提出的快速移动代理（fast moving proxies）机制有效缓解了代理向量梯度过小的问题，且该组件与低温度缩放和全局最大池化具有良好的协同效应。基于上述改进，我们提出的增强模型——ProxyNCA++，在四个不同的零样本图像检索数据集上，Recall@1的平均性能相比原始ProxyNCA算法提升了22.9个百分点。此外，我们在CUB200、Cars196、Sop和InShop数据集上均取得了当前最优（state-of-the-art）的性能，对应的Recall@1得分分别为72.2、90.1、81.4和90.9。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供