摘要
视频帧插值通过生成帧间平滑过渡,实现时间维度上的超分辨率。尽管深度神经网络已取得显著进展,但生成的中间帧在视觉质量上仍存在不足,且常伴有明显伪影。本文提出一种新型网络结构,通过引入残差精炼与自适应权重机制,提升中间帧的合成效果。残差精炼技术用于优化光流估计与图像生成,从而提高精度并改善视觉表现;自适应权重图则融合前向与后向光流扭曲帧,有效降低伪影。此外,本文方法中所有子模块均采用深度较浅的U-Net架构实现,保障了模型的高效性。在多个公开数据集上的实验结果表明,所提方法在性能与视觉质量方面均优于当前最先进的技术。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| video-frame-interpolation-on-msu-video-frame | RRIN | LPIPS: 0.072 MS-SSIM: 0.902 PSNR: 25.76 SSIM: 0.893 VMAF: 59.82 |
| video-frame-interpolation-on-ucf101-1 | RRIN | PSNR: 34.93 SSIM: 0.9496 |
| video-frame-interpolation-on-vimeo90k | RRIN | PSNR: 35.22 SSIM: 0.9643 |