4 个月前

基于上下文的动作识别与R*CNN

基于上下文的动作识别与R*CNN

摘要

图像中存在多种线索可以揭示一个人正在进行的动作。例如,慢跑者的姿势具有典型的慢跑特征,但场景(如道路、小径)和其他慢跑者的存在也可以提供额外的信息来源。在本研究中,我们利用了动作伴随有上下文线索这一简单观察结果,构建了一个强大的动作识别系统。我们将RCNN进行了改进,使其在分类时可以使用多个区域,同时仍保留定位动作的能力。我们称该系统为RCNN。动作特定模型和特征图是联合训练的,这使得动作特定表示得以形成。RCNN在PASAL VOC动作数据集上达到了90.2%的平均AP值,显著优于该领域的其他所有方法。最后,我们展示了RCNN不仅限于动作识别任务。特别是,RCNN还可以用于解决细粒度任务,如属性分类。我们通过在Berkeley人物属性数据集上报告最先进性能来验证这一主张。

代码仓库

gkioxari/RstarCNN
官方
caffe2
GitHub 中提及

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于上下文的动作识别与R*CNN | 论文 | HyperAI超神经