OFFER: Off-environment reinforcement learning

OFFER: Off-environment reinforcement learning

Policy gradient methods have been widely applied in reinforcement learning. For reasons of safety and cost, learning is often conducted using a simulator. However, learning in simulation does not traditionally utilise the opportunity to improve learning by adjusting certain environment variables - s...

Повний опис

Бібліографічні деталі
Автори:	Ciosek, K, Whiteson, S
Формат:	Conference item
Мова:	English
Опубліковано:	AAAI Press 2017

Схожі ресурси

Expected policy gradients for reinforcement learning
за авторством: Ciosek, K, та інші
Опубліковано: (2020)

Robust reinforcement learning with Bayesian optimisation and quadrature
за авторством: Paul, S, та інші
Опубліковано: (2020)

Expected policy gradients
за авторством: Ciosek, K, та інші
Опубліковано: (2018)

Loaded DiCE: Trading off bias and variance in any-order score function gradient estimators for reinforcement learning
за авторством: Farquhar, G, та інші
Опубліковано: (2019)

Fourier policy gradients
за авторством: Fellows, M, та інші
Опубліковано: (2018)

Off-Dynamics Inverse Reinforcement Learning
за авторством: Yachen Kang, та інші
Опубліковано: (2024-01-01)

Inverse reinforcement learning from failure
за авторством: Shiarlis, K, та інші
Опубліковано: (2016)

Deep residual reinforcement learning
за авторством: Zhang, S, та інші
Опубліковано: (2020)

Reinforcement Learning system to capture value from Brazilian post-harvest offers
за авторством: Fernando Henrique Lermen, та інші
Опубліковано: (2024-12-01)

Learning retrospective knowledge with reverse reinforcement learning
за авторством: Zhang, S, та інші
Опубліковано: (2020)

Off-policy reinforcement learning with Gaussian processes
за авторством: Chowdhary, Girish, та інші
Опубліковано: (2015)

Bayesian action decoder for deep multi-agent reinforcement learning
за авторством: Whiteson, S
Опубліковано: (2019)

Fingerprint policy optimisation for robust reinforcement learning
за авторством: Paul, S, та інші
Опубліковано: (2019)

Learning to communicate with Deep multi-agent reinforcement learning
за авторством: Foerster, J, та інші
Опубліковано: (2016)

Deep variational reinforcement learning for POMDPs
за авторством: Igl, M, та інші
Опубліковано: (2018)

Mean−variance policy iteration for risk−averse reinforcement learning
за авторством: Zhang, S, та інші
Опубліковано: (2021)

Enhanced Off-Policy Reinforcement Learning With Focused Experience Replay
за авторством: Seung-Hyun Kong, та інші
Опубліковано: (2021-01-01)

A UNIQUE COLLABORATION: USM FIRST-TIME OFFERING OFF-SHORE ARCHITECTURAL PROGRAMME
за авторством: MPRC, Pusat Media & Perhubungan Awam
Опубліковано: (2015)

VIREL: A variational inference framework for reinforcement learning
за авторством: Fellows, M, та інші
Опубліковано: (2019)

Alternating optimisation and quadrature for robust control
за авторством: Paul, S, та інші
Опубліковано: (2018)

Generalized Off-Policy Actor-Critic
за авторством: Zhang, S, та інші
Опубліковано: (2019)

The potential of offering HIV-related services in an optometry environment
за авторством: Haseena Majid, та інші
Опубліковано: (2020-02-01)

What can catalysts offer for environment pollution control ? /
за авторством: 604334 Wan Azelee Wan Abu Bakar, та інші
Опубліковано: (2001)

Z-Score Experience Replay in Off-Policy Deep Reinforcement Learning
за авторством: Yana Yang, та інші
Опубліковано: (2024-12-01)

Off-Policy Meta-Reinforcement Learning With Belief-Based Task Inference
за авторством: Takahisa Imagawa, та інші
Опубліковано: (2022-01-01)

Transient dynamics in trial-offer markets with social influence: Trade-offs between appeal and quality.
за авторством: Edgar Altszyler, та інші
Опубліковано: (2017-01-01)

Deep Reinforcement Learning in complex environments
за авторством: Nardelli, N
Опубліковано: (2021)

Reactive Reinforcement Learning in Asynchronous Environments
за авторством: Jaden B. Travnik, та інші
Опубліковано: (2018-06-01)

Spirituality in offering a peace offering
за авторством: Nobuyoshi Kiuchi
Опубліковано: (1999-05-01)

Transient non−stationarity and generalisation in deep reinforcement learning
за авторством: Igl, M, та інші
Опубліковано: (2021)

Reinforcement learning based mainline dynamic speed limit adjustment of expressway off‐ramp upstream under connected and autonomous vehicles environment
за авторством: Daiquan Xiao, та інші
Опубліковано: (2022-12-01)

Designing the Inclusive Built Environment: An Exploration of Opportunities Offered by ICTs
за авторством: Emilia Conte
Опубліковано: (2017-07-01)

Exploration in approximate hyper-state space for meta reinforcement learning
за авторством: Zintgraf, L, та інші
Опубліковано: (2021)

Reliability assessment of off-policy deep reinforcement learning: A benchmark for aerodynamics
за авторством: Sandrine Berger, та інші
Опубліковано: (2024-01-01)

Optimal Control of Iron-Removal Systems Based on Off-Policy Reinforcement Learning
за авторством: Ning Chen, та інші
Опубліковано: (2020-01-01)

Multi-agent common knowledge reinforcement learning
за авторством: de Witt, C, та інші
Опубліковано: (2019)

TreeQN and ATreeC: differentiable tree planning for deep reinforcement learning
за авторством: Farquhar, G, та інші
Опубліковано: (2018)

Reinforcement learning enhanced quantum-inspired algorithm for combinatorial optimization
за авторством: Beloborodov, D, та інші
Опубліковано: (2020)

SCIENCE@ALORSETAR TO OFFER BLENDED LEARNING TO STUDENTS
за авторством: MPRC, Pusat Media & Perhubungan Awam
Опубліковано: (2016)

Pioneering New Ways of Offering Learning Assistance
за авторством: Deborah Parra
Опубліковано: (1997-10-01)