4 个月前

卷积神经网络

计算机视觉

计算机视觉

Lea Colin Reiter Austin Vidal Rene Hager Gregory D.

摘要

细粒度动作的联合分割与分类在人机交互、视频监控及人类技能评估等应用中具有重要意义。然而，尽管大规模动作分类领域近年来取得了显著进展，当前最先进的细粒度动作识别方法性能仍然有限。为此，我们提出了一种结合低层时空特征与高层分段分类器的动作分割模型。该模型中的时空卷积神经网络（CNN）包含两个组成部分：空间分支利用卷积滤波器捕捉物体及其相互关系的信息，时间分支则采用大尺寸一维卷积滤波器，以捕捉物体间关系随时间演变的动态特征。这些提取出的时空特征与一个半马尔可夫模型相结合，用于建模不同动作之间的状态转移。我们进一步提出一种高效的约束性分段推理算法，其计算速度比现有方法快多个数量级。在烹饪动作与外科手术动作数据集上的实验结果表明，所提出的分段时空CNN模型显著优于近期的基准方法，充分验证了其有效性。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

4 个月前

卷积神经网络

计算机视觉

计算机视觉

Lea Colin Reiter Austin Vidal Rene Hager Gregory D.

摘要

细粒度动作的联合分割与分类在人机交互、视频监控及人类技能评估等应用中具有重要意义。然而，尽管大规模动作分类领域近年来取得了显著进展，当前最先进的细粒度动作识别方法性能仍然有限。为此，我们提出了一种结合低层时空特征与高层分段分类器的动作分割模型。该模型中的时空卷积神经网络（CNN）包含两个组成部分：空间分支利用卷积滤波器捕捉物体及其相互关系的信息，时间分支则采用大尺寸一维卷积滤波器，以捕捉物体间关系随时间演变的动态特征。这些提取出的时空特征与一个半马尔可夫模型相结合，用于建模不同动作之间的状态转移。我们进一步提出一种高效的约束性分段推理算法，其计算速度比现有方法快多个数量级。在烹饪动作与外科手术动作数据集上的实验结果表明，所提出的分段时空CNN模型显著优于近期的基准方法，充分验证了其有效性。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供