4 个月前

艺术中的人体姿态:数字艺术史中的人体姿态估计数据集

艺术中的人体姿态:数字艺术史中的人体姿态估计数据集

摘要

在艺术史中,姿态作为人体表达的整体抽象,已被证明在众多研究中具有恒定性。然而,由于迄今为止需要手动处理的大量数据,自古以来姿态在艺术历史主题公式化再现中的关键作用只能被选择性地突出。即使对于现在已自动化的姿态估计,训练计算模型所需的领域特定且足够大的数据集要么未公开可用,要么索引粒度不够精细。通过《艺术中的人体姿态数据集》(Poses of People in Art),我们引入了首个公开许可的艺术人体姿态估计和验证数据集。该数据集包含来自22种艺术历史表现风格的2,454幅图像,包括自19世纪以来逐渐远离逼真人体表现的风格。总共10,749个人物形象被精确地用矩形边界框包围,每幅图像最多有四个人物被标记多达17个关键点;这些关键点主要为关节如肘部和膝盖。为了机器学习的目的,该数据集被划分为三个子集:训练集、验证集和测试集,分别遵循既定的基于JSON的Microsoft COCO格式。每个图像注释除了必填字段外,还提供了来自艺术历史在线百科全书WikiArt的元数据。本文详细介绍了数据集的获取和构成,探讨了各种应用场景,并讨论了数字支持下的艺术史前景。我们展示了该数据集能够对艺术中的身体现象进行研究,无论是从单个人物形象的细微之处捕捉其特征,还是考虑整个人物组合之间的位置、距离或接近程度。

基准测试

基准方法指标
object-detection-on-peopleartTOOD (Task-aligned One-stage Object Detection; trained on PeopleArt and PoPArt)
mAP: 47.8
mAP@0.5: 78.0
mAP@0.75: 49.9
object-detection-on-peopleartTOOD (Task-aligned One-stage Object Detection)
mAP: 46.1
mAP@0.5: 75.0
mAP@0.75: 49.0
object-detection-on-peopleartPVT (Pyramid Vision Transformer)
mAP: 46.5
mAP@0.5: 76.0
mAP@0.75: 48.4
object-detection-on-peopleartPVT (Pyramid Vision Transformer; trained on PeopleArt and PopArt)
mAP: 49.7
mAP@0.5: 80.5
mAP@0.75: 51.8

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
艺术中的人体姿态:数字艺术史中的人体姿态估计数据集 | 论文 | HyperAI超神经