
摘要
近年来,从视频中评估动作质量引起了越来越多的关注。现有的大多数方法通常基于回归算法来解决这一问题,但这些算法忽略了由于多位裁判或其主观评价而导致的分数标签固有的模糊性。为了解决这一问题,我们提出了一种不确定性感知的评分分布学习(USDL)方法,用于动作质量评估(AQA)。具体而言,我们将一个动作视为与其评分分布相关的一个实例,该评分分布描述了不同评价分数的概率。此外,在细粒度评分标签可用的情况下(例如,动作的难度等级或来自不同裁判的多个评分),我们进一步设计了一种多路径不确定性感知的评分分布学习(MUSDL)方法,以探索评分的不同解耦成分。我们在包含各种奥运项目和外科手术活动的三个AQA数据集上进行了实验,在Spearman秩相关系数指标下,我们的方法达到了新的最先进水平。
代码仓库
nzl-thu/musdl
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| action-quality-assessment-on-aqa-7 | USDL | RL2(*100): 2.57 Spearman Correlation: 81.02% |
| action-quality-assessment-on-aqa-7 | I3D+MLP | Spearman Correlation: 74.72% |
| action-quality-assessment-on-mtl-aqa | USDL | RL2(*100): 0.609 Spearman Correlation: 90.66 |
| action-quality-assessment-on-mtl-aqa | I3D+MLP | Spearman Correlation: 89.21 |
| action-quality-assessment-on-mtl-aqa | MUSDL(w/ DD) | RL2(*100): 0.451 Spearman Correlation: 92.73 |
| action-quality-assessment-on-mtl-aqa | USDL(w/ DD) | RL2(*100): 0.468 Spearman Correlation: 92.31 |
| action-quality-assessment-on-mtl-aqa | MUSDL | RL2(*100): 0.654 Spearman Correlation: 91.58 |