4 个月前

生成式低比特宽度无数据量化

生成式低比特宽度无数据量化

摘要

神经网络量化是一种有效的方法,用于压缩深度模型并提高其执行延迟和能效,从而使其能够在移动或嵌入式设备上部署。现有的量化方法通常需要原始数据进行校准或微调以获得更好的性能。然而,在许多实际场景中,由于数据的机密性或隐私问题,原始数据可能无法获取,这使得现有的量化方法难以应用。此外,由于缺乏原始数据,最近开发的生成对抗网络(GANs)也无法用于生成数据。尽管全精度模型可能包含丰富的数据信息,但仅凭这些信息很难恢复原始数据或生成新的有意义的数据。在本文中,我们研究了一种简单而有效的方法,称为生成低比特宽度无数据量化(GDFQ),旨在消除对数据依赖的需求。具体而言,我们提出了一种知识匹配生成器,通过利用预训练模型中的分类边界知识和分布信息来生成有意义的虚假数据。借助生成的数据,我们可以从预训练模型中学习知识来进行模型量化。我们在三个数据集上进行了广泛的实验,证明了该方法的有效性。更重要的是,我们的方法在4位量化上的准确率远高于现有的无数据量化方法。代码可在 https://github.com/xushoukai/GDFQ 获取。

代码仓库

ricky40403/GDFQ
pytorch
GitHub 中提及
xushoukai/GDFQ
官方
pytorch
GitHub 中提及
iamkanghyunchoi/ait
pytorch
GitHub 中提及

基准测试

基准方法指标
data-free-quantization-on-cifar-100ResNet-20 CIFAR-100
CIFAR-100 W4A4 Top-1 Accuracy: 43.12
CIFAR-100 W5A5 Top-1 Accuracy: 64.03
CIFAR-100 W6A6 Top-1 Accuracy: 68.63
CIFAR-100 W8A8 Top-1 Accuracy: 70.29
data-free-quantization-on-cifar10ResNet-20 CIFAR-10
CIFAR-10 W4A4 Top-1 Accuracy: 85.20
CIFAR-10 W5A5 Top-1 Accuracy: 92.39
CIFAR-10 W6A6 Top-1 Accuracy: 93.38
CIFAR-10 W8A8 Top-1 Accuracy: 93.92

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
生成式低比特宽度无数据量化 | 论文 | HyperAI超神经