3 个月前

CoordFlow:用于像素级神经视频表示的坐标流

CoordFlow:用于像素级神经视频表示的坐标流

摘要

在视频压缩领域,如何在更低的码率下实现更优的视频质量,始终是一个长期追求的目标。近年来的研究表明,隐式神经表示(Implicit Neural Representation, INR)作为一种有前景的替代方案,展现出超越传统基于变换的方法的潜力。根据网络输出结构的不同,视频INR大致可分为逐帧(frame-wise)与逐像素(pixel-wise)两类方法。尽管逐像素方法在超分辨率重建和并行化处理方面更具优势,但逐帧方法在性能上表现更优。本文提出一种新型的逐像素INR方法——CoordFlow,其在与现有逐像素INR方法的对比中取得了当前最优的压缩性能,并在关键指标上达到与领先逐帧方法相当的水平。该方法的核心思想是将视觉信息分解为若干视觉一致的层次,每一层由专用网络进行建模,并独立补偿该层的运动信息。在模型集成后,自然产生一种无监督的视频序列分割结果。通过隐式利用物体运动轨迹,该方法有效缓解了视频中时空冗余问题。此外,所提出的方法还具备天然的视频超分辨率、稳定化、图像修复(inpainting)及去噪能力,展现出强大的多功能性与应用潜力。

基准测试

基准方法指标
video-reconstruction-on-uvgCoordFlow
Average PSNR (dB): 36.54
Model Size (M): 12.68M

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
CoordFlow:用于像素级神经视频表示的坐标流 | 论文 | HyperAI超神经