3 个月前

IFRNet:用于高效帧插值的中间特征精炼网络

IFRNet:用于高效帧插值的中间特征精炼网络

摘要

现有的视频帧插值算法通常通过连续输入帧生成中间帧,但其普遍依赖复杂的模型架构与庞大的参数量,或存在较大的延迟,限制了其在多样化实时应用场景中的部署。本文提出一种高效且基于编码器-解码器结构的网络框架,命名为IFRNet,用于快速生成中间帧。该方法首先从输入帧中提取多尺度特征,随后通过逐步优化双边中间光流场与中间特征表示,最终生成目标输出。逐步精细化的中间特征不仅有助于提升中间光流的估计精度,还能有效补全上下文细节信息,从而使IFRNet无需额外的合成或后处理模块即可实现高质量输出。为进一步释放模型潜力,我们提出一种新型面向任务的光流蒸馏损失函数,聚焦于提取对帧插值任务具有实际价值的教师模型知识。同时,引入一种新的几何一致性正则化项,作用于逐步优化的中间特征,以保持更优的结构布局。在多个公开基准数据集上的实验结果表明,所提方法在性能与推理速度方面均表现出色。代码已开源,地址为:https://github.com/ltkong218/IFRNet。

代码仓库

ltkong218/ifrnet
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
video-frame-interpolation-on-middleburyIFRNet
Interpolation Error: 4.216
video-frame-interpolation-on-msu-video-frameIFRNet_large
LPIPS: 0.037
MS-SSIM: 0.943
PSNR: 28.04
SSIM: 0.921
VMAF: 66.98
video-frame-interpolation-on-msu-video-frameIFRNet_small
LPIPS: 0.049
MS-SSIM: 0.931
PSNR: 27.45
SSIM: 0.908
VMAF: 63.43
video-frame-interpolation-on-msu-video-frameIFRNet_base
LPIPS: 0.048
MS-SSIM: 0.932
PSNR: 27.67
SSIM: 0.909
VMAF: 64.16
video-frame-interpolation-on-ucf101-1IFRNet
PSNR: 35.42
SSIM: 0.9698
video-frame-interpolation-on-vimeo90kIFRNet
PSNR: 36.20
SSIM: 0.9808
Speed (ms/f): 16 (Tesla V100)

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
IFRNet:用于高效帧插值的中间特征精炼网络 | 论文 | HyperAI超神经