
摘要
手部经常被物体严重遮挡,这使得三维手部网格估计变得极具挑战性。以往的研究通常忽略了遮挡区域的信息。然而,我们认为遮挡区域与手部之间存在强烈的关联,因此可以提供对完整三维手部网格估计极为有益的信息。为此,在本工作中,我们提出了一种新颖的三维手部网格估计网络——HandOccNet,该网络能够充分利用遮挡区域的信息作为辅助手段来增强图像特征,使其更加丰富。为了实现这一目标,我们设计了两个连续的基于Transformer的模块,分别称为特征注入Transformer(FIT)和自增强Transformer(SET)。FIT通过考虑遮挡区域与手部之间的相关性,将手部信息注入到遮挡区域中。SET则利用自注意力机制进一步优化FIT的输出。通过将手部信息注入到遮挡区域,我们的HandOccNet在包含具有挑战性的手-物遮挡情况的三维手部网格基准测试中达到了最先进的性能。代码可从以下链接获取:https://github.com/namepllet/HandOccNet。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| 3d-hand-pose-estimation-on-dexycb | HandOccNet | Average MPJPE (mm): 14.0 MPVPE: 13.1 PA-MPVPE: 5.5 PA-VAUC: 89.0 Procrustes-Aligned MPJPE: 5.80 VAUC: 76.6 |
| 3d-hand-pose-estimation-on-hint-hand | HandOccNet (param) | PCK@0.05 (Ego4D) All: 7.7 PCK@0.05 (Ego4D) Occ: 8.0 PCK@0.05 (Ego4D) Visible: 7.3 PCK@0.05 (New Days) All: 9.1 PCK@0.05 (NewDays) Occ: 7.2 PCK@0.05 (NewDays) Visible: 10.2 PCK@0.05 (VISOR) All: 8.1 PCK@0.05 (VISOR) Occ: 7.4 PCK@0.05 (VISOR) Visible: 8.5 |
| 3d-hand-pose-estimation-on-hint-hand | HandOccNet (no param) | PCK@0.05 (Ego4D) All: 10.9 PCK@0.05 (Ego4D) Occ: 9.6 PCK@0.05 (Ego4D) Visible: 11.2 PCK@0.05 (New Days) All: 13.7 PCK@0.05 (NewDays) Occ: 9.8 PCK@0.05 (NewDays) Visible: 15.7 PCK@0.05 (VISOR) All: 12.4 PCK@0.05 (VISOR) Occ: 9.9 PCK@0.05 (VISOR) Visible: 13.1 |
| 3d-hand-pose-estimation-on-ho-3d | HandOccNet | AUC_J: 0.819 AUC_V: 0.819 F@15mm: 0.963 F@5mm: 0.564 PA-MPJPE (mm): 9.1 PA-MPVPE: 8.8 |