8 个月前

卷积神经网络

Shoukai Xu Haokun Li Bohan Zhuang Jing Liu Jiezhang Cao Chuangrun Liang Mingkui Tan

摘要

神经网络量化是一种有效的方法，用于压缩深度模型并提高其执行延迟和能效，从而使其能够在移动或嵌入式设备上部署。现有的量化方法通常需要原始数据进行校准或微调以获得更好的性能。然而，在许多实际场景中，由于数据的机密性或隐私问题，原始数据可能无法获取，这使得现有的量化方法难以应用。此外，由于缺乏原始数据，最近开发的生成对抗网络（GANs）也无法用于生成数据。尽管全精度模型可能包含丰富的数据信息，但仅凭这些信息很难恢复原始数据或生成新的有意义的数据。在本文中，我们研究了一种简单而有效的方法，称为生成低比特宽度无数据量化（GDFQ），旨在消除对数据依赖的需求。具体而言，我们提出了一种知识匹配生成器，通过利用预训练模型中的分类边界知识和分布信息来生成有意义的虚假数据。借助生成的数据，我们可以从预训练模型中学习知识来进行模型量化。我们在三个数据集上进行了广泛的实验，证明了该方法的有效性。更重要的是，我们的方法在4位量化上的准确率远高于现有的无数据量化方法。代码可在 https://github.com/xushoukai/GDFQ 获取。

源 PDF 查看代码

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

8 个月前

卷积神经网络

Shoukai Xu Haokun Li Bohan Zhuang Jing Liu Jiezhang Cao Chuangrun Liang Mingkui Tan

摘要

神经网络量化是一种有效的方法，用于压缩深度模型并提高其执行延迟和能效，从而使其能够在移动或嵌入式设备上部署。现有的量化方法通常需要原始数据进行校准或微调以获得更好的性能。然而，在许多实际场景中，由于数据的机密性或隐私问题，原始数据可能无法获取，这使得现有的量化方法难以应用。此外，由于缺乏原始数据，最近开发的生成对抗网络（GANs）也无法用于生成数据。尽管全精度模型可能包含丰富的数据信息，但仅凭这些信息很难恢复原始数据或生成新的有意义的数据。在本文中，我们研究了一种简单而有效的方法，称为生成低比特宽度无数据量化（GDFQ），旨在消除对数据依赖的需求。具体而言，我们提出了一种知识匹配生成器，通过利用预训练模型中的分类边界知识和分布信息来生成有意义的虚假数据。借助生成的数据，我们可以从预训练模型中学习知识来进行模型量化。我们在三个数据集上进行了广泛的实验，证明了该方法的有效性。更重要的是，我们的方法在4位量化上的准确率远高于现有的无数据量化方法。代码可在 https://github.com/xushoukai/GDFQ 获取。

源 PDF 查看代码

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

生成式低比特宽度无数据量化 | 论文 | HyperAI超神经