3 个月前

HMQ:面向CNN的硬件友好型混合精度量化模块

HMQ:面向CNN的硬件友好型混合精度量化模块

摘要

近期在神经网络量化领域的研究通过采用混合精度量化方法,取得了当前最优的性能表现。然而,许多高效边缘设备硬件实现的一个关键要求是其量化器必须采用均匀量化且阈值为2的幂次。为此,本文提出了一种面向硬件友好的混合精度量化模块(Hardware-Friendly Mixed Precision Quantization Block, HMQ),以满足这一需求。HMQ是一种混合精度量化模块,其创新性地将Gumbel-Softmax估计器重构为对一对量化参数——即比特宽度(bit-width)与阈值(threshold)——的平滑估计器。基于此机制,HMQ能够在有限的量化方案空间中进行高效搜索。实验上,我们将HMQ应用于在CIFAR10和ImageNet数据集上训练的分类模型进行量化。在ImageNet数据集上,我们对四种不同的网络架构进行了量化实验,结果表明,尽管量化方案受到额外约束,HMQ仍能取得具有竞争力的性能,甚至在某些情况下达到当前最优水平。

代码仓库

sony-si/ai-research
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
quantization-on-imagenetEfficientNet-B0-W4A4
Activation bits: 4
Top-1 Accuracy (%): 76
Weight bits: 4
quantization-on-imagenetResNet50-W3A4
Activation bits: 4
Top-1 Accuracy (%): 75.45
Weight bits: 3
quantization-on-imagenetMobileNetV2
Top-1 Accuracy (%): 70.9
quantization-on-imagenetEfficientNet-B0-W8A8
Activation bits: 8
Top-1 Accuracy (%): 76.4
Weight bits: 8

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
HMQ:面向CNN的硬件友好型混合精度量化模块 | 论文 | HyperAI超神经