
摘要
绝大多数数据是自动采集的,且仅能被算法“感知”。然而,数据压缩器在压缩过程中不仅保留算法执行下游任务所需的必要信息,更注重保持人类感知上的保真度。本文中,我们刻画了在一组变换(如数据增强)下保持不变的所有预测任务均能获得高性能所需的比特率。基于该理论,我们设计了用于训练神经压缩器的无监督目标函数。利用这些目标函数,我们训练出一种通用图像压缩器,在8个数据集上相比JPEG实现了显著的码率压缩(在ImageNet数据集上压缩超过1000倍),同时未降低下游分类任务的性能。
代码仓库
YannDubs/lossyless
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| image-compression-on-caltech101 | Lossyless Compressor | Bit rate: 1340 |
| image-compression-on-cars-196 | Lossyless Compressor | Bit rate: 1470 |
| image-compression-on-cifar-10 | Lossyless Compressor | Bit rate: 1410 |
| image-compression-on-food-101 | Lossyless Compressor | Bit rate: 1270 |
| image-compression-on-oxford-iiit-pets | Lossyless Compressor | Bit rate: 1210 |
| image-compression-on-pcam | Lossyless Compressor | Bit rate: 1490 |
| image-compression-on-stl-10 | Lossyless Compressor | Bit rate: 1340 |