
摘要
我们提出一个全新的、具有挑战性的数据集——CPPE-5(Medical Personal Protective Equipment,医疗个人防护装备),旨在支持对医疗个人防护装备的细粒度类别识别(即下位类别分类)研究。现有主流数据集(如PASCAL VOC、ImageNet、Microsoft COCO、OpenImages等)主要聚焦于宽泛的类别层次,无法满足此类细粒度分类任务的需求。为便于在复杂场景的实际应用中使用基于本数据集训练的模型,我们的数据集主要包含在自然场景下呈现的复杂图像,每幅图像中包含多个物体,以真实、多样的上下文环境为特征。本数据集的图像采集重点在于:尽可能获取非典型(non-iconic)图像,并确保所有图像均为真实生活场景中的实拍图像,这与当前该领域其他数据集普遍存在的理想化或合成图像存在显著区别。数据集涵盖5个物体类别:防护服(coveralls)、面罩(face shields)、手套(gloves)、口罩(masks)和护目镜(goggles),每张图像均配有边界框(bounding boxes)及对应的正样本标签。我们对CPPE-5数据集进行了详尽的分析,将其与现有的主流宽泛类别数据集以及专注于个人防护装备的数据集进行对比,发现目前尚无公开可用的同类数据集。此外,我们还对基准模型与当前先进模型在边界框检测任务上的性能表现进行了评估,并对比了不同模型的复杂度。相关代码、数据集及训练好的模型均已开源,可访问 https://git.io/cppe5-dataset 获取。
代码仓库
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| object-detection-on-cppe-5 | Double Heads | AP50: 87.3 AP75: 55.2 APL: 60.8 APM: 41.0 APS: 38.6 box AP: 52.0 |
| object-detection-on-cppe-5 | YOLOv3 | AP50: 79.4 AP75: 35.3 APL: 49.0 APM: 28.4 APS: 23.1 box AP: 38.5 |
| object-detection-on-cppe-5 | Sparse RCNN | AP50: 69.6 AP75: 44.6 APL: 54.7 APM: 30.6 APS: 30.0 box AP: 44.0 |
| object-detection-on-cppe-5 | Deformable DETR | AP50: 76.9 AP75: 52.8 APL: 53.9 APM: 35.2 APS: 36.4 box AP: 48.0 |
| object-detection-on-cppe-5 | RegNet | AP50: 85.3 AP75: 51.8 APL: 60.5 APM: 41.1 APS: 35.7 box AP: 51.3 |
| object-detection-on-cppe-5 | TridentNet | AP50: 85.1 AP75: 58.3 APL: 62.6 APM: 41.3 APS: 42.6 box AP: 52.9 |
| object-detection-on-cppe-5 | FCOS | AP50: 79.5 AP75: 45.9 APL: 51.7 APM: 39.2 APS: 36.7 box AP: 44.4 |
| object-detection-on-cppe-5 | RepPoints | AP50: 75.9 AP75: 40.1 APL: 48.0 APM: 36.7 APS: 27.3 box AP: 43.0 |
| object-detection-on-cppe-5 | VarifocalNet | AP50: 82.6 AP75: 56.7 APL: 58.8 APM: 42.1 APS: 39.0 box AP: 51.0 |
| object-detection-on-cppe-5 | Empirical Attention | AP50: 86.5 AP75: 54.1 APL: 61.0 APM: 43.4 APS: 38.7 box AP: 52.5 |
| object-detection-on-cppe-5 | Deformable Convolutional Network | AP50: 87.1 AP75: 55.9 APL: 61.3 APM: 41.4 APS: 36.3 box AP: 51.6 |
| object-detection-on-cppe-5 | Faster RCNN | AP50: 73.8 AP75: 47.8 APL: 52.5 APM: 34.7 APS: 30.0 box AP: 44.0 |
| object-detection-on-cppe-5 | Grid RCNN | AP50: 77.9 AP75: 50.6 APL: 54.4 APM: 37.2 APS: 43.4 box AP: 47.5 |
| object-detection-on-cppe-5 | Localization Distillation | AP50: 76.5 AP75: 58.8 APL: 59.4 APM: 43.0 APS: 45.8 box AP: 50.9 |
| object-detection-on-cppe-5 | FSAF | AP50: 84.7 AP75: 48.2 APL: 56.7 APM: 39.6 APS: 45.3 box AP: 49.2 |
| object-detection-on-cppe-5 | SSD | AP50: 57.0 AP75: 24.9 APL: 34.6 APM: 23.1 APS: 32.1 box AP: 29.50 |