3 个月前

通过最优传输防止向量量化中的局部陷阱

通过最优传输防止向量量化中的局部陷阱

摘要

向量量化网络(Vector-quantized Networks, VQNs)在多种任务中展现出卓越的性能,但其训练过程易受不稳定性影响,这主要源于对精细初始化、模型蒸馏等技术的依赖。本研究发现,局部极小值问题是导致该不稳定性的重要根源。为解决这一问题,我们提出用最优传输(optimal transport)方法替代传统的最近邻搜索,以实现更具全局信息的向量分配。为此,我们提出了OptVQ——一种新型向量量化方法,该方法采用Sinkhorn算法求解最优传输问题,从而显著提升了训练过程的稳定性和效率。为进一步缓解不同数据分布对Sinkhorn算法的影响,我们设计了一种简单而有效的归一化策略。在图像重建任务上的大量实验表明,OptVQ实现了100%的码本利用率,并在重建质量上超越了当前最先进的VQN方法。

代码仓库

zbr17/OptVQ
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
image-reconstruction-on-imagenetOptVQ (16x16x8)
FID: 0.91
LPIPS: 0.066
PSNR: 27.57
SSIM: 0.729
image-reconstruction-on-imagenetOptVQ (16x16x4)
FID: 1.00
LPIPS: 0.076
PSNR: 26.59
SSIM: 0.717

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
通过最优传输防止向量量化中的局部陷阱 | 论文 | HyperAI超神经