3 个月前

仅使用风格迁移提升艺术图像中的目标检测性能

仅使用风格迁移提升艺术图像中的目标检测性能

摘要

尽管深度学习神经网络在目标检测领域取得了显著进展,这些模型在识别艺术图像(如绘画和素描)中的物体时仍面临挑战。这一难题被称为“跨表现形式问题”(cross depiction problem),其部分原因在于神经网络倾向于优先关注物体的纹理特征,而非其形状结构。本文提出并评估了一种训练神经网络以定位艺术图像中目标(特别是人物)的流程。我们通过使用AdaIn风格迁移技术对COCO数据集中的图像进行修改,构建了一个大规模的训练与验证数据集。该数据集用于微调Faster R-CNN目标检测网络,随后在现有的People-Art测试数据集上进行评估。实验结果表明,该方法显著超越了当前最先进的性能水平,并为未来构建用于训练神经网络处理艺术图像的数据集提供了新的可行路径。

代码仓库

基准测试

基准方法指标
object-detection-on-peopleartFasterRCNN (trained on StyleCOCO)
mAP: 36
mAP@0.5: 68
mAP@0.75: 33

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
仅使用风格迁移提升艺术图像中的目标检测性能 | 论文 | HyperAI超神经