3 个月前

图像增强即所需:从像素出发正则化深度强化学习

图像增强即所需:从像素出发正则化深度强化学习

摘要

我们提出了一种简单且通用的数据增强技术,可直接应用于标准的无模型强化学习算法,使其能够直接从像素输入中实现鲁棒学习,而无需依赖辅助损失函数或预训练过程。该方法利用计算机视觉任务中常见的输入扰动来正则化价值函数,从而提升学习稳定性。现有的无模型方法(如软演员-评论家算法,SAC)在直接从图像像素训练深层网络时表现不佳。然而,通过引入我们提出的增强方法,SAC的性能得到显著提升,能够在DeepMind控制基准(DeepMind Control Suite)上达到当前最先进的水平,超越了多种基于模型的方法(如Dreamer、PlaNet和SLAC)以及近期提出的对比学习方法(CURL)。该方法可与任意无模型强化学习算法结合使用,仅需进行少量代码修改。相关实现可访问:https://sites.google.com/view/data-regularized-q。

代码仓库

denisyarats/drq
官方
pytorch
GitHub 中提及
YaoMarkMu/DRQTRANS
pytorch
GitHub 中提及
xingyu-lin/softagent
pytorch
GitHub 中提及

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
图像增强即所需:从像素出发正则化深度强化学习 | 论文 | HyperAI超神经