3 个月前

基于增强相关性匹配的视频帧插值

基于增强相关性匹配的视频帧插值

摘要

我们提出了一种基于深度神经网络(DNN)的新型框架,称为“增强相关性匹配视频帧插值网络”(Enhanced Correlation Matching based Video Frame Interpolation Network),以支持高分辨率(如4K)视频的帧插值,尤其适用于具有大尺度运动和遮挡的场景。考虑到网络模型在不同分辨率下的可扩展性,所提方案采用递归金字塔架构,通过在金字塔各层之间共享参数来实现光流估计。在光流估计过程中,通过追踪相关性最大位置的方式,对光流进行递归精炼。基于前向变形的相关性匹配机制,能够有效排除遮挡区域附近错误变形的特征,从而提升光流更新的准确性。在获得最终的双向光流后,利用变形与融合网络合成任意时间位置的中间帧,并进一步通过精炼网络进行优化。实验结果表明,该方法在4K视频数据以及低分辨率基准数据集上,均在客观与主观质量方面优于现有方法,且所用模型参数量最小。

基准测试

基准方法指标
video-frame-interpolation-on-vimeo90kECMNet
PSNR: 34.95
SSIM: 0.9749
video-frame-interpolation-on-x4k1000fpsECMNet
PSNR: 30.51
SSIM: 0.8719

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于增强相关性匹配的视频帧插值 | 论文 | HyperAI超神经