3 个月前

如何训练你的神经ODE:雅可比矩阵与动能正则化的世界

如何训练你的神经ODE:雅可比矩阵与动能正则化的世界

摘要

在大规模数据集上训练神经微分方程(neural ODEs)长期以来面临挑战,其主要原因在于需要让自适应数值微分方程求解器将步长细化至极小值,这在实际中导致系统动态等效于数百甚至数千层的深度结构。本文通过提出一种具有理论依据的组合正则化方法,有效克服了这一难题:该方法结合了最优传输(optimal transport)与稳定性正则化,促使神经ODE在能够良好求解问题的所有动态中,优先选择更为简单的动态形式。更简单的动态不仅加速了收敛过程,还显著减少了求解器的离散化次数,从而大幅降低实际运行时间,同时不损失模型性能。我们的方法使基于神经ODE的生成模型能够达到与未加正则化动态相当的性能水平,且训练时间显著缩短。这一进展使神经ODE在大规模实际应用中的可行性得到了实质性提升。

代码仓库

cfinlay/ffjord-rnode
pytorch
GitHub 中提及

基准测试

基准方法指标
density-estimation-on-celeba-hq-256x256RNODE
Log-likelihood: 1.04
density-estimation-on-cifar-10RNODE
NLL (bits/dim): 3.38
density-estimation-on-imagenet-64x64RNODE
Log-likelihood: 3.83
density-estimation-on-mnistRNODE
NLL (bits/dim): 0.97
image-generation-on-celeba-hq-256x256RNODE
bits/dimension: 1.04
image-generation-on-mnistRNODE
bits/dimension: 0.97

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
如何训练你的神经ODE:雅可比矩阵与动能正则化的世界 | 论文 | HyperAI超神经