4 months ago

Deep Exploration via Bootstrapped DQN

Ian Osband; Charles Blundell; Alexander Pritzel; Benjamin Van Roy

Abstract

Efficient exploration in complex environments remains a major challenge for reinforcement learning. We propose bootstrapped DQN, a simple algorithm that explores in a computationally and statistically efficient manner through use of randomized value functions. Unlike dithering strategies such as epsilon-greedy exploration, bootstrapped DQN carries out temporally-extended (or deep) exploration; this can lead to exponentially faster learning. We demonstrate these benefits in complex stochastic MDPs and in the large-scale Arcade Learning Environment. Bootstrapped DQN substantially improves learning times and performance across most Atari games.

Code Repositories

johannah/bootstrap_dqn

pytorch

Mentioned in GitHub

yaringal/HeteroscedasticDropoutUncertainty

Mentioned in GitHub

tensorflow/models

Mentioned in GitHub

mrahtz/learning-from-human-preferences

Mentioned in GitHub

tensorflow/models/tree/master/research/deep_contextual_bandits

Mentioned in GitHub

NervanaSystems/coach

Mentioned in GitHub

Benchmarks

Benchmark	Methodology	Metrics
atari-games-on-atari-2600-alien	Bootstrapped DQN	Score: 2436.6
atari-games-on-atari-2600-amidar	Bootstrapped DQN	Score: 1272.5
atari-games-on-atari-2600-assault	Bootstrapped DQN	Score: 8047.1
atari-games-on-atari-2600-asterix	Bootstrapped DQN	Score: 19713.2
atari-games-on-atari-2600-asteroids	Bootstrapped DQN	Score: 1032
atari-games-on-atari-2600-atlantis	Bootstrapped DQN	Score: 994500
atari-games-on-atari-2600-bank-heist	Bootstrapped DQN	Score: 1208
atari-games-on-atari-2600-battle-zone	Bootstrapped DQN	Score: 38666.7
atari-games-on-atari-2600-beam-rider	Bootstrapped DQN	Score: 23429.8
atari-games-on-atari-2600-bowling	Bootstrapped DQN	Score: 60.2
atari-games-on-atari-2600-boxing	Bootstrapped DQN	Score: 93.2
atari-games-on-atari-2600-breakout	Bootstrapped DQN	Score: 855
atari-games-on-atari-2600-centipede	Bootstrapped DQN	Score: 4553.5
atari-games-on-atari-2600-chopper-command	Bootstrapped DQN	Score: 4100
atari-games-on-atari-2600-crazy-climber	Bootstrapped DQN	Score: 137925.9
atari-games-on-atari-2600-demon-attack	Bootstrapped DQN	Score: 82610
atari-games-on-atari-2600-double-dunk	Bootstrapped DQN	Score: 3
atari-games-on-atari-2600-enduro	Bootstrapped DQN	Score: 1591
atari-games-on-atari-2600-fishing-derby	Bootstrapped DQN	Score: 26
atari-games-on-atari-2600-freeway	Bootstrapped DQN	Score: 33.9
atari-games-on-atari-2600-frostbite	Bootstrapped DQN	Score: 2181.4
atari-games-on-atari-2600-gopher	Bootstrapped DQN	Score: 17438.4
atari-games-on-atari-2600-gravitar	Bootstrapped DQN	Score: 286.1
atari-games-on-atari-2600-hero	Bootstrapped DQN	Score: 21021.3
atari-games-on-atari-2600-ice-hockey	Bootstrapped DQN	Score: -1.3
atari-games-on-atari-2600-james-bond	Bootstrapped DQN	Score: 1663.5
atari-games-on-atari-2600-kangaroo	Bootstrapped DQN	Score: 14862.5
atari-games-on-atari-2600-krull	Bootstrapped DQN	Score: 8627.9
atari-games-on-atari-2600-kung-fu-master	Bootstrapped DQN	Score: 36733.3
atari-games-on-atari-2600-montezumas-revenge	Bootstrapped DQN	Score: 100
atari-games-on-atari-2600-ms-pacman	Bootstrapped DQN	Score: 2983.3
atari-games-on-atari-2600-name-this-game	Bootstrapped DQN	Score: 11501.1
atari-games-on-atari-2600-pong	Bootstrapped DQN	Score: 20.9
atari-games-on-atari-2600-private-eye	Bootstrapped DQN	Score: 1812.5
atari-games-on-atari-2600-qbert	Bootstrapped DQN	Score: 15092.7
atari-games-on-atari-2600-river-raid	Bootstrapped DQN	Score: 12845
atari-games-on-atari-2600-road-runner	Bootstrapped DQN	Score: 51500
atari-games-on-atari-2600-robotank	Bootstrapped DQN	Score: 66.6
atari-games-on-atari-2600-seaquest	Bootstrapped DQN	Score: 9083.1
atari-games-on-atari-2600-space-invaders	Bootstrapped DQN	Score: 2893
atari-games-on-atari-2600-star-gunner	Bootstrapped DQN	Score: 55725
atari-games-on-atari-2600-tennis	Bootstrapped DQN	Score: 0
atari-games-on-atari-2600-time-pilot	Bootstrapped DQN	Score: 9079.4
atari-games-on-atari-2600-tutankham	Bootstrapped DQN	Score: 214.8
atari-games-on-atari-2600-up-and-down	Bootstrapped DQN	Score: 26231
atari-games-on-atari-2600-venture	Bootstrapped DQN	Score: 212.5
atari-games-on-atari-2600-video-pinball	Bootstrapped DQN	Score: 811610
atari-games-on-atari-2600-wizard-of-wor	Bootstrapped DQN	Score: 6804.7
atari-games-on-atari-2600-zaxxon	Bootstrapped DQN	Score: 11491.7

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding

Ready-to-use GPUs

Best Pricing

Get Started

Hyper Newsletters

Subscribe to our latest updates

We will deliver the latest updates of the week to your inbox at nine o'clock every Monday morning

Command Palette

Deep Exploration via Bootstrapped DQN

Ian Osband; Charles Blundell; Alexander Pritzel; Benjamin Van Roy

Abstract

Code Repositories

Benchmarks

Build AI with AI

Hyper Newsletters