4 个月前

深度时空随机字段在高效视频分割中的应用

深度时空随机字段在高效视频分割中的应用

摘要

在这项工作中,我们提出了一种时间和内存高效的方法,用于结构化预测,该方法在空间和时间上耦合了神经元决策。通过利用近期关于深度高斯条件随机场(Gaussian Conditional Random Fields, GCRFs)的研究进展,我们展示了能够在密集连接的空间-时间图上进行精确且高效的推理。我们的方法称为VideoGCRF,具有以下特点:(a) 高效性,(b) 拥有唯一的全局最小值,(c) 可以与现代深度网络一起端到端地训练,用于视频理解。我们在时间域中实验了多种连通模式,并在语义分割和实例分割任务中展示了相对于强大基线模型的经验改进。

基准测试

基准方法指标
semantic-segmentation-on-camvidVideoGCRF
Mean IoU: 75.2

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
深度时空随机字段在高效视频分割中的应用 | 论文 | HyperAI超神经