
摘要
我们提出了一种首个实用的基于学习的无损图像压缩系统——L3C,并证明其性能优于流行的工程编解码器PNG、WebP和JPEG 2000。我们的方法核心是一种完全可并行化的分层概率模型,用于自适应熵编码,并针对压缩任务进行了端到端优化。与最近的自回归离散概率模型(如PixelCNN)不同,我们的方法i) 通过学习到的辅助表示与图像分布联合建模,而不仅仅是对RGB空间中的图像分布进行建模;ii) 只需要三次前向传递即可预测所有像素的概率,而不是每个像素都需要一次前向传递。因此,L3C在采样时比最快的PixelCNN变体(Multiscale-PixelCNN)快两个数量级以上。此外,我们发现学习辅助表示至关重要,并且显著优于预定义的辅助表示(如RGB金字塔)。
代码仓库
tuatruog/astrocompress
pytorch
GitHub 中提及
fab-jul/torchac
pytorch
GitHub 中提及
fab-jul/L3C-PyTorch
官方
pytorch
GitHub 中提及
PaulEmmanuelSotir/DeepCV
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| image-compression-on-imagenet32 | L3C | bpsp: 4.76 |
| image-compression-on-imagenet32 | JPEG2000 | bpsp: 6.35 |
| image-compression-on-imagenet32 | PNG | bpsp: 6.42 |