3 个月前

画出那双鞋

画出那双鞋

摘要

我们研究了细粒度草图图像检索(Sketch-Based Image Retrieval, SBIR)问题,其中以手绘草图作为查询,实现图像的实例级检索。这一任务极具挑战性,原因在于:(i)视觉比对不仅需要具备细粒度特性,还需在跨域之间进行;(ii)手绘(手指绘制)草图具有高度抽象性,进一步增加了细粒度匹配的难度;尤为重要的是,(iii)用于训练的跨域草图-照片标注数据集极为稀缺,这对众多前沿机器学习技术构成了严峻挑战。本文首次系统性地应对上述所有挑战,为实现商业化草图图像检索应用所依赖的核心能力迈出关键一步。我们构建了一个全新的数据集,包含来自两个类别的1,432对草图-照片图像,并提供了32,000条细粒度三元组排序标注。在此基础上,我们提出了一种深度三元组排序模型,用于实例级SBIR任务,并设计了一种新颖的数据增强策略与分阶段预训练方法,以缓解细粒度训练数据不足的问题。通过大量实验,我们深入探讨了在训练深度网络进行细粒度跨域排序任务时,数据充足性与过拟合规避等方面的诸多关键挑战,为该领域提供了丰富的实践洞察与技术参考。

基准测试

基准方法指标
sketch-based-image-retrieval-on-chairsSketch-a-Net + rankSVM
R@1: 47.4
R@10: 82.5
sketch-based-image-retrieval-on-chairsBoW-HOG + rankSVM
R@1: 28.9
R@10: 67.0
sketch-based-image-retrieval-on-chairsShoes net +
R@1: 65.0
R@10: 92.8
sketch-based-image-retrieval-on-chairsDense-HOG + rankSVM
R@1: 52.6
R@10: 93.8
sketch-based-image-retrieval-on-chairsChairs net +
R@1: 72.2
R@10: 99.0
sketch-based-image-retrieval-on-handbagsChairs net +
R@1: 26.2
R@10: 58.3
sketch-based-image-retrieval-on-handbagsDense-HOG + rankSVM
R@1: 15.5
R@10: 40.5
sketch-based-image-retrieval-on-handbagsShoes net +
R@1: 23.2
R@10: 59.5
sketch-based-image-retrieval-on-handbagsSketch-a-Net + rankSVM
R@1: 9.5
R@10: 44.1
sketch-based-image-retrieval-on-handbagsBoW-HOG + rankSVM
R@1: 2.4
R@10: 10.7

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供