3 个月前

用于监控视频中事件识别的分层上下文模型

用于监控视频中事件识别的分层上下文模型

摘要

由于监控视频中存在类内差异巨大、图像分辨率低等重大挑战,上下文信息在实现准确且鲁棒的事件识别任务中正发挥着日益重要的作用。上下文信息通常可划分为特征级上下文、语义级上下文和先验级上下文三个层次。这三个层次的上下文分别提供了对事件识别任务至关重要的自下而上、中层以及自上而下的信息支持。与现有研究通常仅在三个层次中的某一个层面整合上下文信息不同,本文提出一种分层上下文模型,能够同时利用三个层次的上下文信息,并系统性地将其融入事件识别过程。为应对模型层次结构所带来的学习与推理挑战,本文基于变分贝叶斯(variational Bayes)方法,设计了完整的模型学习与推理算法。在VIRAT 1.0和2.0地面实况数据集上的实验结果表明,所提出的分层上下文模型在面对类内差异大、图像分辨率低等严峻挑战时,仍能显著提升事件识别的性能,验证了其有效性。

基准测试

基准方法指标
action-recognition-in-videos-on-virat-groundDHCM
Average Accuracy: 66.45

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
用于监控视频中事件识别的分层上下文模型 | 论文 | HyperAI超神经