6 个月前

计算机视觉

计算机视觉

Xin Jin Longhai Wu Guotao Shen Youxin Chen Jie Chen Jayoon Koo Cheul-hee Hahm

摘要

我们提出了一种新颖、简洁 yet 高效的基于运动的视频帧插值算法。现有的基于运动的插值方法通常依赖于预训练的光流模型或基于U-Net的金字塔网络进行运动估计，这类方法要么模型规模庞大，要么在处理复杂且大范围运动时能力受限。在本工作中，我们通过精心设计，将中间帧导向的前向映射（forward-warping）、轻量级特征编码器以及相关体积（correlation volume）集成到一个金字塔递归框架中，构建了一个紧凑的模型，能够同时估计输入帧之间的双向运动。该模型体积仅为PWC-Net的1/15，却在处理具有挑战性的运动场景时展现出更可靠且更灵活的性能。基于估计出的双向运动，我们将输入帧及其上下文特征前向映射至中间帧位置，并通过一个合成网络从映射后的表示中重建中间帧。所提方法在多种主流视频帧插值基准测试中均取得了优异的表现。代码与训练好的模型已开源，地址为：\url{https://github.com/srcn-ivl/EBME}。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

计算机视觉

计算机视觉

Xin Jin Longhai Wu Guotao Shen Youxin Chen Jie Chen Jayoon Koo Cheul-hee Hahm

摘要

我们提出了一种新颖、简洁 yet 高效的基于运动的视频帧插值算法。现有的基于运动的插值方法通常依赖于预训练的光流模型或基于U-Net的金字塔网络进行运动估计，这类方法要么模型规模庞大，要么在处理复杂且大范围运动时能力受限。在本工作中，我们通过精心设计，将中间帧导向的前向映射（forward-warping）、轻量级特征编码器以及相关体积（correlation volume）集成到一个金字塔递归框架中，构建了一个紧凑的模型，能够同时估计输入帧之间的双向运动。该模型体积仅为PWC-Net的1/15，却在处理具有挑战性的运动场景时展现出更可靠且更灵活的性能。基于估计出的双向运动，我们将输入帧及其上下文特征前向映射至中间帧位置，并通过一个合成网络从映射后的表示中重建中间帧。所提方法在多种主流视频帧插值基准测试中均取得了优异的表现。代码与训练好的模型已开源，地址为：\url{https://github.com/srcn-ivl/EBME}。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供