OFFER: Off-environment reinforcement learning

OFFER: Off-environment reinforcement learning

Policy gradient methods have been widely applied in reinforcement learning. For reasons of safety and cost, learning is often conducted using a simulator. However, learning in simulation does not traditionally utilise the opportunity to improve learning by adjusting certain environment variables - s...

Deskribapen osoa

Xehetasun bibliografikoak
Egile Nagusiak:	Ciosek, K, Whiteson, S
Formatua:	Conference item
Hizkuntza:	English
Argitaratua:	AAAI Press 2017

Antzeko izenburuak

Expected policy gradients for reinforcement learning
nork: Ciosek, K, et al.
Argitaratua: (2020)

Robust reinforcement learning with Bayesian optimisation and quadrature
nork: Paul, S, et al.
Argitaratua: (2020)

Expected policy gradients
nork: Ciosek, K, et al.
Argitaratua: (2018)

Loaded DiCE: Trading off bias and variance in any-order score function gradient estimators for reinforcement learning
nork: Farquhar, G, et al.
Argitaratua: (2019)

Fourier policy gradients
nork: Fellows, M, et al.
Argitaratua: (2018)

Off-Dynamics Inverse Reinforcement Learning
nork: Yachen Kang, et al.
Argitaratua: (2024-01-01)

Inverse reinforcement learning from failure
nork: Shiarlis, K, et al.
Argitaratua: (2016)

Deep residual reinforcement learning
nork: Zhang, S, et al.
Argitaratua: (2020)

Reinforcement Learning system to capture value from Brazilian post-harvest offers
nork: Fernando Henrique Lermen, et al.
Argitaratua: (2024-12-01)

Learning retrospective knowledge with reverse reinforcement learning
nork: Zhang, S, et al.
Argitaratua: (2020)

Off-policy reinforcement learning with Gaussian processes
nork: Chowdhary, Girish, et al.
Argitaratua: (2015)

Bayesian action decoder for deep multi-agent reinforcement learning
nork: Whiteson, S
Argitaratua: (2019)

Fingerprint policy optimisation for robust reinforcement learning
nork: Paul, S, et al.
Argitaratua: (2019)

Learning to communicate with Deep multi-agent reinforcement learning
nork: Foerster, J, et al.
Argitaratua: (2016)

Deep variational reinforcement learning for POMDPs
nork: Igl, M, et al.
Argitaratua: (2018)

Mean−variance policy iteration for risk−averse reinforcement learning
nork: Zhang, S, et al.
Argitaratua: (2021)

Enhanced Off-Policy Reinforcement Learning With Focused Experience Replay
nork: Seung-Hyun Kong, et al.
Argitaratua: (2021-01-01)

A UNIQUE COLLABORATION: USM FIRST-TIME OFFERING OFF-SHORE ARCHITECTURAL PROGRAMME
nork: MPRC, Pusat Media & Perhubungan Awam
Argitaratua: (2015)

VIREL: A variational inference framework for reinforcement learning
nork: Fellows, M, et al.
Argitaratua: (2019)

Alternating optimisation and quadrature for robust control
nork: Paul, S, et al.
Argitaratua: (2018)

Generalized Off-Policy Actor-Critic
nork: Zhang, S, et al.
Argitaratua: (2019)

The potential of offering HIV-related services in an optometry environment
nork: Haseena Majid, et al.
Argitaratua: (2020-02-01)

What can catalysts offer for environment pollution control ? /
nork: 604334 Wan Azelee Wan Abu Bakar, et al.
Argitaratua: (2001)

Z-Score Experience Replay in Off-Policy Deep Reinforcement Learning
nork: Yana Yang, et al.
Argitaratua: (2024-12-01)

Off-Policy Meta-Reinforcement Learning With Belief-Based Task Inference
nork: Takahisa Imagawa, et al.
Argitaratua: (2022-01-01)

Transient dynamics in trial-offer markets with social influence: Trade-offs between appeal and quality.
nork: Edgar Altszyler, et al.
Argitaratua: (2017-01-01)

Deep Reinforcement Learning in complex environments
nork: Nardelli, N
Argitaratua: (2021)

Reactive Reinforcement Learning in Asynchronous Environments
nork: Jaden B. Travnik, et al.
Argitaratua: (2018-06-01)

Spirituality in offering a peace offering
nork: Nobuyoshi Kiuchi
Argitaratua: (1999-05-01)

Transient non−stationarity and generalisation in deep reinforcement learning
nork: Igl, M, et al.
Argitaratua: (2021)

Reinforcement learning based mainline dynamic speed limit adjustment of expressway off‐ramp upstream under connected and autonomous vehicles environment
nork: Daiquan Xiao, et al.
Argitaratua: (2022-12-01)

Designing the Inclusive Built Environment: An Exploration of Opportunities Offered by ICTs
nork: Emilia Conte
Argitaratua: (2017-07-01)

Exploration in approximate hyper-state space for meta reinforcement learning
nork: Zintgraf, L, et al.
Argitaratua: (2021)

Reliability assessment of off-policy deep reinforcement learning: A benchmark for aerodynamics
nork: Sandrine Berger, et al.
Argitaratua: (2024-01-01)

Optimal Control of Iron-Removal Systems Based on Off-Policy Reinforcement Learning
nork: Ning Chen, et al.
Argitaratua: (2020-01-01)

Multi-agent common knowledge reinforcement learning
nork: de Witt, C, et al.
Argitaratua: (2019)

TreeQN and ATreeC: differentiable tree planning for deep reinforcement learning
nork: Farquhar, G, et al.
Argitaratua: (2018)

Reinforcement learning enhanced quantum-inspired algorithm for combinatorial optimization
nork: Beloborodov, D, et al.
Argitaratua: (2020)

SCIENCE@ALORSETAR TO OFFER BLENDED LEARNING TO STUDENTS
nork: MPRC, Pusat Media & Perhubungan Awam
Argitaratua: (2016)

Pioneering New Ways of Offering Learning Assistance
nork: Deborah Parra
Argitaratua: (1997-10-01)