5 个月前

TransNet:一种用于快速检测常见镜头转换的深度网络

TransNet:一种用于快速检测常见镜头转换的深度网络

摘要

镜头边界检测(SBD)是许多视频处理应用中的重要第一步。本文提出了一种简单的模块化卷积神经网络架构,在单个性能一般的GPU上实现了远超实时的推理速度,同时在RAI数据集上取得了最先进的结果。该网络采用了扩张卷积,并仅对缩小后的帧进行操作。训练过程中使用了从TRECVID IACC.3数据集中选取的镜头随机生成的过渡。代码和经过选择训练的网络将在https://github.com/soCzech/TransNet 上提供。

代码仓库

soCzech/TransNet
官方
tf
GitHub 中提及
soCzech/TransNetV2
tf
GitHub 中提及
wqliu657/TransNetV2
tf
GitHub 中提及

基准测试

基准方法指标
camera-shot-boundary-detection-on-msu-shotSaeid Dadkhan
F score: 0.7686
FPS: 93

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
TransNet:一种用于快速检测常见镜头转换的深度网络 | 论文 | HyperAI超神经