
摘要
组合模型通过多层次有意义的部件及其子部件来表征模式。其能够刻画人体各部位之间的高阶关系,有助于缓解人体姿态估计(Human Pose Estimation, HPE)中的低层歧义问题。然而,以往的组合模型在子部件与主部件之间的关系上做出了不切实际的假设,难以有效建模复杂的组合结构。此外,其高层部件的状态空间可能呈指数级增长,导致推理与学习过程变得极为复杂。为解决上述问题,本文提出一种新型框架——深度学习组合模型(Deeply Learned Compositional Model, DLCM),用于人体姿态估计。该模型利用深度神经网络学习人体结构的组合特性,构建出具有层次化组合架构的网络,并包含自底向上与自顶向下相结合的推理机制。此外,本文提出一种基于骨骼的部件表示方法,该表示不仅能紧凑地编码各部件的方向、尺度与形状信息,还能有效避免因状态空间过大带来的计算负担。得益于显著降低的模型复杂度,所提方法在三个主流基准数据集上的实验结果均优于现有最先进方法,展现出卓越的性能。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| pose-estimation-on-mpii-human-pose | DLCM | PCKh-0.5: 92.3 |