7 个月前

摘要

每一刻都对动作识别至关重要。为了全面理解视频中的人类活动，需要根据发生的动作对每一帧进行标注，并在视频序列上密集地放置多个标签。为了研究这一问题，我们扩展了现有的THUMOS数据集，并引入了MultiTHUMOS，这是一个针对不受限制的互联网视频的密集标签新数据集。建模多个密集标签可以从类内和类间的时序关系中受益。我们定义了一种新的长短期记忆（LSTM）深度网络变体，通过多个输入和输出连接来建模这些时序关系。实验结果表明，该模型提高了动作标注的准确性，并进一步支持了从结构化检索到动作预测等一系列更深层次的理解任务。

源 PDF

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

7 个月前

Serena Yeung Olga Russakovsky Ning Jin Mykhaylo Andriluka Greg Mori Li Fei-Fei

摘要

每一刻都对动作识别至关重要。为了全面理解视频中的人类活动，需要根据发生的动作对每一帧进行标注，并在视频序列上密集地放置多个标签。为了研究这一问题，我们扩展了现有的THUMOS数据集，并引入了MultiTHUMOS，这是一个针对不受限制的互联网视频的密集标签新数据集。建模多个密集标签可以从类内和类间的时序关系中受益。我们定义了一种新的长短期记忆（LSTM）深度网络变体，通过多个输入和输出连接来建模这些时序关系。实验结果表明，该模型提高了动作标注的准确性，并进一步支持了从结构化检索到动作预测等一系列更深层次的理解任务。

源 PDF

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

Command Palette

每一刻都很重要：复杂视频中动作的密集详细标注

Serena Yeung Olga Russakovsky Ning Jin Mykhaylo Andriluka Greg Mori Li Fei-Fei

摘要

用 AI 构建 AI

HyperAI Newsletters

Command Palette

每一刻都很重要：复杂视频中动作的密集详细标注

Serena Yeung Olga Russakovsky Ning Jin Mykhaylo Andriluka Greg Mori Li Fei-Fei

摘要

用 AI 构建 AI

HyperAI Newsletters

Command Palette

每一刻都很重要：复杂视频中动作的密集详细标注

Serena Yeung Olga Russakovsky Ning Jin Mykhaylo Andriluka Greg Mori Li Fei-Fei

摘要

用 AI 构建 AI

HyperAI Newsletters