
摘要
绘图是强有力的图像抽象和交流手段。理解和分析各种形式的绘图,包括数字艺术、卡通和漫画,一直是计算机视觉和计算机图形学领域的重大研究课题。尽管从漫画书和卡通中可以获得大量数字化绘图,但这些绘图包含广泛的艺术风格变化,这需要昂贵的手动标注来训练特定领域的识别器。在本研究中,我们展示了如何利用基于教师-学生网络的自监督学习方法,并通过改进的学生网络更新设计来构建面部和身体检测器。我们的设置允许在目标域中有大量未标注数据的情况下,仅对其中的一小部分提供标签即可进行利用。此外,我们还证明了可以在学习流程中融入风格迁移技术,以利用来自自然图像(即现实世界中的图像)的大量域外已标注图像来引导检测器的训练。我们的综合架构能够在最小化标注工作量的前提下实现最先进的(SOTA)和接近最先进的(near-SOTA)性能。我们的代码可以从 https://github.com/barisbatuhan/DASS_Detector 获取。
代码仓库
barisbatuhan/dass_det_inference
官方
pytorch
GitHub 中提及
barisbatuhan/dass_detector
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| body-detection-on-clipart1k | DASS-Detector (YOLOX XL) | MAP : 83.59 |
| body-detection-on-comic2k | DASS-Detector (YOLOX XL) | MAP : 73.65 |
| body-detection-on-dcm | DASS-Detector (YOLOX Tiny) | Average Precision: 87.06 |
| body-detection-on-dcm | DASS-Detector (YOLOX XL) | Average Precision: 86.14 |
| body-detection-on-manga109 | DASS-Detector (YOLOX XL) | Average Precision: 87.98 |
| body-detection-on-watercolor2k | DASS-Detector (YOLOX XL) | MAP : 89.81 |
| face-detection-on-dcm | DASS-Detector (YOLOX XL) | Average Precision: 77.40 |
| face-detection-on-dcm | DASS-Detector (YOLOX Tiny) | Average Precision: 77.40 |
| face-detection-on-icartoonface | DASS-Detector (YOLOX Tiny) | Average Precision: 87.75 |
| face-detection-on-icartoonface | DASS-Detector (YOLOX XL) | Average Precision: 90.01 |
| face-detection-on-manga109 | DASS-Detector (YOLOX XL) | Average Precision: 87.88 |
| object-detection-on-manga109 | DASS-Detector (YOLOX Tiny) | Average Precision: 87.46 |
| object-detection-on-manga109 | DASS-Detector (YOLOX XL) | Average Precision: 87.93 |
| weakly-supervised-object-detection-on-1 | DASS-Detector (YOLOX Tiny) | MAP: 71.53 |
| weakly-supervised-object-detection-on-2 | DASS-Detector (YOLOX Tiny) | MAP: 64.25 |
| weakly-supervised-object-detection-on-comic2k | DASS-Detector (YOLOX Tiny) | MAP: 67.41 |