3 个月前

Benchopt:可复现、高效且协作的优化基准

Benchopt:可复现、高效且协作的优化基准

摘要

数值验证是机器学习研究的核心环节,它能够评估新方法的实际效果,并验证理论与实践之间的一致性。然而,该领域的快速发展带来了诸多挑战:研究人员面临大量需比较的方法、缺乏透明度与最佳实践的共识,以及繁琐的重复实现工作。结果导致验证过程往往十分片面,可能引发错误结论,从而阻碍研究进展。为此,我们提出 Benchopt——一个协作式框架,旨在跨编程语言和硬件架构自动化、可复现地开展机器学习优化算法的基准测试。Benchopt 通过提供开箱即用的工具,简化了社区在运行、共享与扩展实验方面的流程。为展示其广泛的适用性,我们展示了在三个标准学习任务上的基准测试:$\ell_2$-正则化逻辑回归、Lasso 回归,以及用于图像分类的 ResNet18 训练。这些基准测试揭示了若干关键的实用发现,为这些问题的当前技术水平提供了更为细致的洞察,表明在实际评估中,细节决定成败。我们期望 Benchopt 能够推动社区内的协作研究,从而提升研究成果的可复现性。

代码仓库

deepmind/optax
jax
GitHub 中提及
benchopt/benchopt
官方
GitHub 中提及
google-deepmind/optax
jax
GitHub 中提及

基准测试

基准方法指标
image-classification-on-cifar-10ResNet-18
Percentage correct: 95.55
image-classification-on-svhnResNet-18
Percentage error: 2.65
stochastic-optimization-on-cifar-10-resnet-18SGD - cosine LR schedule
Accuracy: 95.55

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
Benchopt:可复现、高效且协作的优化基准 | 论文 | HyperAI超神经