
摘要
本文提出了一种基于深度学习的logo识别方法。所提出的识别流程包括两个阶段:首先生成logo候选区域,随后采用专为logo分类任务训练的卷积神经网络(Convolutional Neural Network, CNN),即使logo在图像中未被精确定位,该方法仍能有效识别。我们在FlickrLogos-32数据集上进行了实验,评估了合成数据增强与真实数据增强、以及图像预处理对识别性能的影响。此外,我们系统地研究了多种训练策略的优劣,包括类别平衡(class-balancing)、样本加权(sample-weighting)以及显式建模背景类(即无logo区域)的作用。实验结果证实了所提方法的可行性,其性能优于当前最先进的方法。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| image-classification-on-flickrlogos-32 | TC-VII (with outside data) | Accuracy: 96.0 |
| image-classification-on-flickrlogos-32 | TC-VII (without outside data) | Accuracy: 91.7 |