4 个月前

实用全分辨率学习无损图像压缩

实用全分辨率学习无损图像压缩

摘要

我们提出了一种首个实用的基于学习的无损图像压缩系统——L3C,并证明其性能优于流行的工程编解码器PNG、WebP和JPEG 2000。我们的方法核心是一种完全可并行化的分层概率模型,用于自适应熵编码,并针对压缩任务进行了端到端优化。与最近的自回归离散概率模型(如PixelCNN)不同,我们的方法i) 通过学习到的辅助表示与图像分布联合建模,而不仅仅是对RGB空间中的图像分布进行建模;ii) 只需要三次前向传递即可预测所有像素的概率,而不是每个像素都需要一次前向传递。因此,L3C在采样时比最快的PixelCNN变体(Multiscale-PixelCNN)快两个数量级以上。此外,我们发现学习辅助表示至关重要,并且显著优于预定义的辅助表示(如RGB金字塔)。

代码仓库

tuatruog/astrocompress
pytorch
GitHub 中提及
fab-jul/torchac
pytorch
GitHub 中提及
fab-jul/L3C-PyTorch
官方
pytorch
GitHub 中提及
PaulEmmanuelSotir/DeepCV
pytorch
GitHub 中提及

基准测试

基准方法指标
image-compression-on-imagenet32L3C
bpsp: 4.76
image-compression-on-imagenet32JPEG2000
bpsp: 6.35
image-compression-on-imagenet32PNG
bpsp: 6.42

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
实用全分辨率学习无损图像压缩 | 论文 | HyperAI超神经