3 个月前

通过检测动作边界缓解过度分割错误

通过检测动作边界缓解过度分割错误

摘要

我们提出了一种针对时序动作分割任务的有效框架,即动作片段精炼框架(Action Segment Refinement Framework, ASRF)。该模型架构包含一个长期特征提取器以及两个分支:动作分割分支(Action Segmentation Branch, ASB)和边界回归分支(Boundary Regression Branch, BRB)。长期特征提取器为两个分支提供具有宽时域感受野的共享特征。ASB负责对视频帧进行动作类别分类,而BRB则对动作边界的概率进行回归。BRB预测的动作边界用于精炼ASB的输出,从而显著提升整体性能。本研究的主要贡献有三方面:(i)我们提出了一种面向时序动作分割的ASRF框架,将该任务分解为帧级动作分类与动作边界回归两个阶段。该框架通过预测的动作边界对帧级动作类别假设进行精炼,提升了分割精度;(ii)我们设计了一种用于平滑动作概率过渡的损失函数,并系统分析了多种损失函数组合在时序动作分割任务中的表现;(iii)所提出的框架在三个具有挑战性的公开数据集上均优于现有最先进方法,段级编辑距离(segmental edit distance)最高提升达13.7%,段级F1分数最高提升达16.1%。相关代码将很快公开发布。

代码仓库

yiskw713/asrf
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
action-segmentation-on-50-salads-1ASRF
Acc: 84.5
Edit: 79.3
F1@10%: 84.9
F1@25%: 83.5
F1@50%: 77.3
action-segmentation-on-breakfast-1ASRF
Acc: 67.6
Average F1: 66.4
Edit: 72.4
F1@10%: 74.3
F1@25%: 68.9
F1@50%: 56.1
action-segmentation-on-gtea-1ASRF
Acc: 77.3
Edit: 83.7
F1@10%: 89.4
F1@25%: 87.8
F1@50%: 79.8

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
通过检测动作边界缓解过度分割错误 | 论文 | HyperAI超神经