4 个月前

使用深度强化学习玩Atari游戏

使用深度强化学习玩Atari游戏

摘要

我们提出了首个成功利用强化学习从高维感官输入中直接学习控制策略的深度学习模型。该模型是一个卷积神经网络,采用Q-learning的一种变体进行训练,其输入为原始像素,输出为估计未来奖励的价值函数。我们将该方法应用于Arcade Learning Environment中的七款Atari 2600游戏,且未对架构或学习算法进行任何调整。研究结果表明,该模型在六款游戏中超越了所有先前的方法,并在其中三款游戏中超过了人类专家的表现。

代码仓库

alfredvc/paac
tf
GitHub 中提及
proroklab/popgym
pytorch
GitHub 中提及
Rabrg/dqn
pytorch
GitHub 中提及
rishavb123/MineRL
tf
GitHub 中提及
marload/deep-rl-tf2
tf
GitHub 中提及
avillemin/Minecraft-AI
pytorch
GitHub 中提及
daviddcho/supermario
pytorch
GitHub 中提及
JackFurby/Breakout
tf
GitHub 中提及
spragunr/deep_q_rl
GitHub 中提及
parilo/rl-server
tf
GitHub 中提及
joshiatul/game_playing
GitHub 中提及
markusdutschke/yahtzee
GitHub 中提及
bjotho/Zelda1AI
GitHub 中提及
nandomp/AICollaboratory
GitHub 中提及
JonasRSV/DQN
tf
GitHub 中提及
niklasschmitz/DeepQLearning
jax
GitHub 中提及
rikluost/RL_DQN_Pong
tf
GitHub 中提及
tcmxx/CNTKUnityTools
GitHub 中提及
R-Stefano/DQN
tf
GitHub 中提及
grass123-hub/DQN
mindspore
GitHub 中提及
2023-MindSpore-1/ms-code-52
mindspore
GitHub 中提及
near32/regym
pytorch
GitHub 中提及
Sheepsody/Batched-Impala-PyTorch
pytorch
GitHub 中提及
K-tang-mkv/baseRLAlgorithm
pytorch
GitHub 中提及
vsquareg/RL_ERA
tf
GitHub 中提及
Gary-Shi/Tank
GitHub 中提及
omkarv/pong-from-pixels
GitHub 中提及
tlohr/nfsu2-ai
tf
GitHub 中提及
eddynelson/dqn
tf
GitHub 中提及
bay3s/dqn
pytorch
RLeike/connect-four
jax
GitHub 中提及
KavindaKottege/DeepQ-Pong
tf
GitHub 中提及
behzaad/Deep_QLearning
GitHub 中提及
sygi/deep_q_rl
GitHub 中提及
subhadip-maiti/tinydqn
tf
GitHub 中提及
RandyDeng/gym_connect4
GitHub 中提及
KatyNTsachi/Hierarchical-RL
tf
GitHub 中提及
invictos/InsacarDQN
tf
GitHub 中提及
kmdanielduan/DQN_Family_PyTorch
pytorch
GitHub 中提及
InSpaceAI/RL-Zoo
tf
GitHub 中提及
komejisatori/ReinforcementCar
pytorch
GitHub 中提及
blakeMilner/DeepQLearning
pytorch
GitHub 中提及
LukasGardberg/cartpole
tf
GitHub 中提及
dsgiitr/rl_2048
tf
GitHub 中提及
jonaths/tf-dqn
tf
GitHub 中提及
eublefar/dqn
tf
GitHub 中提及
nathanin/pad
tf
GitHub 中提及
JonasRSV/DQNTensorflow
tf
GitHub 中提及
sourenaKhanzadeh/snakeAi
pytorch
GitHub 中提及
esmeralday/MARL
GitHub 中提及
ninja18/AtariDQN
tf
GitHub 中提及
jonaths/dqn-grid
tf
GitHub 中提及
borea17/efficient_rl
GitHub 中提及
marload/DeepRL-TensorFlow2
tf
GitHub 中提及
qiankun214/DQN-FlappyBird-python3
pytorch
GitHub 中提及
natsumeS/analysis
GitHub 中提及
TheFebrin/DeepRL-Pong
pytorch
GitHub 中提及
vincentpalma/DQN-for-CaRL
pytorch
GitHub 中提及
mfregeau/DeepLearning
GitHub 中提及
SayhoKim/tetrisRL
tf
GitHub 中提及
ugo-nama-kun/DQN-chainer
GitHub 中提及
yaxinchen666/dce_pricingRL
tf
GitHub 中提及
MOVzeroOne/DQN
pytorch
GitHub 中提及

基准测试

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
使用深度强化学习玩Atari游戏 | 论文 | HyperAI超神经