
摘要
镜头边界检测(SBD)是许多视频处理应用中的重要第一步。本文提出了一种简单的模块化卷积神经网络架构,在单个性能一般的GPU上实现了远超实时的推理速度,同时在RAI数据集上取得了最先进的结果。该网络采用了扩张卷积,并仅对缩小后的帧进行操作。训练过程中使用了从TRECVID IACC.3数据集中选取的镜头随机生成的过渡。代码和经过选择训练的网络将在https://github.com/soCzech/TransNet 上提供。
代码仓库
soCzech/TransNet
官方
tf
GitHub 中提及
soCzech/TransNetV2
tf
GitHub 中提及
wqliu657/TransNetV2
tf
GitHub 中提及
shallwe999/TransNetV2-SBD-Visualize
tf
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| camera-shot-boundary-detection-on-msu-shot | Saeid Dadkhan | F score: 0.7686 FPS: 93 |