OFFER: Off-environment reinforcement learning

OFFER: Off-environment reinforcement learning

Policy gradient methods have been widely applied in reinforcement learning. For reasons of safety and cost, learning is often conducted using a simulator. However, learning in simulation does not traditionally utilise the opportunity to improve learning by adjusting certain environment variables - s...

पूर्ण विवरण

ग्रंथसूची विवरण
मुख्य लेखकों:	Ciosek, K, Whiteson, S
स्वरूप:	Conference item
भाषा:	English
प्रकाशित:	AAAI Press 2017

समान संसाधन

Expected policy gradients for reinforcement learning
द्वारा: Ciosek, K, और अन्य
प्रकाशित: (2020)

Robust reinforcement learning with Bayesian optimisation and quadrature
द्वारा: Paul, S, और अन्य
प्रकाशित: (2020)

Expected policy gradients
द्वारा: Ciosek, K, और अन्य
प्रकाशित: (2018)

Fourier policy gradients
द्वारा: Fellows, M, और अन्य
प्रकाशित: (2018)

Loaded DiCE: Trading off bias and variance in any-order score function gradient estimators for reinforcement learning
द्वारा: Farquhar, G, और अन्य
प्रकाशित: (2019)

Off-policy reinforcement learning with Gaussian processes
द्वारा: Chowdhary, Girish, और अन्य
प्रकाशित: (2015)

Deep residual reinforcement learning
द्वारा: Zhang, S, और अन्य
प्रकाशित: (2020)

Learning retrospective knowledge with reverse reinforcement learning
द्वारा: Zhang, S, और अन्य
प्रकाशित: (2020)

Inverse reinforcement learning from failure
द्वारा: Shiarlis, K, और अन्य
प्रकाशित: (2016)

Bayesian action decoder for deep multi-agent reinforcement learning
द्वारा: Whiteson, S
प्रकाशित: (2019)

Fingerprint policy optimisation for robust reinforcement learning
द्वारा: Paul, S, और अन्य
प्रकाशित: (2019)

Learning to communicate with Deep multi-agent reinforcement learning
द्वारा: Foerster, J, और अन्य
प्रकाशित: (2016)

Generalized Off-Policy Actor-Critic
द्वारा: Zhang, S, और अन्य
प्रकाशित: (2019)

Deep variational reinforcement learning for POMDPs
द्वारा: Igl, M, और अन्य
प्रकाशित: (2018)

Mean−variance policy iteration for risk−averse reinforcement learning
द्वारा: Zhang, S, और अन्य
प्रकाशित: (2021)

A UNIQUE COLLABORATION: USM FIRST-TIME OFFERING OFF-SHORE ARCHITECTURAL PROGRAMME
द्वारा: MPRC, Pusat Media & Perhubungan Awam
प्रकाशित: (2015)

What can catalysts offer for environment pollution control ? /
द्वारा: 604334 Wan Azelee Wan Abu Bakar, और अन्य
प्रकाशित: (2001)

VIREL: A variational inference framework for reinforcement learning
द्वारा: Fellows, M, और अन्य
प्रकाशित: (2019)

Alternating optimisation and quadrature for robust control
द्वारा: Paul, S, और अन्य
प्रकाशित: (2018)

Deep Reinforcement Learning in complex environments
द्वारा: Nardelli, N
प्रकाशित: (2021)

SCIENCE@ALORSETAR TO OFFER BLENDED LEARNING TO STUDENTS
द्वारा: MPRC, Pusat Media & Perhubungan Awam
प्रकाशित: (2016)

Transient non−stationarity and generalisation in deep reinforcement learning
द्वारा: Igl, M, और अन्य
प्रकाशित: (2021)

Environment poisoning in reinforcement learning: attacks and resilience
द्वारा: Xu, Hang
प्रकाशित: (2023)

Deep reinforcement learning for complex environment 1
द्वारा: Goh, Peng Aik
प्रकाशित: (2024)

Multi-agent common knowledge reinforcement learning
द्वारा: de Witt, C, और अन्य
प्रकाशित: (2019)

TreeQN and ATreeC: differentiable tree planning for deep reinforcement learning
द्वारा: Farquhar, G, और अन्य
प्रकाशित: (2018)

Reinforcement learning enhanced quantum-inspired algorithm for combinatorial optimization
द्वारा: Beloborodov, D, और अन्य
प्रकाशित: (2020)

Exploration in approximate hyper-state space for meta reinforcement learning
द्वारा: Zintgraf, L, और अन्य
प्रकाशित: (2021)

24-hour room offers comfort for continuous learning
द्वारा: Iswan Akim, Ismail
प्रकाशित: (2020)

CIReL offers trainings on online teaching and learning
द्वारा: UMP, PNC
प्रकाशित: (2020)

UneVEn: Universal value exploration for multi-agent reinforcement learning
द्वारा: Gupta, T, और अन्य
प्रकाशित: (2021)

Analysing factorizations of action-value networks for cooperative multi-agent reinforcement learning
द्वारा: Castellini, J, और अन्य
प्रकाशित: (2021)

Average-reward off-policy policy evaluation with function approximation
द्वारा: Zhang, S, और अन्य
प्रकाशित: (2021)

Reinforcement Learning in Multidimensional Environments Relies on Attention Mechanisms
द्वारा: Niv, Yael, और अन्य
प्रकाशित: (2016)

Robustness of Reinforcement Learning Systems in Real-World Environments
द्वारा: Garau Luis, Juan José
प्रकाशित: (2023)

Stabilising experience replay for deep multi-agent reinforcement learning
द्वारा: Foerster, J, और अन्य
प्रकाशित: (2017)

Randomized entity-wise factorization for multi-agent reinforcement learning
द्वारा: Iqbal, S, और अन्य
प्रकाशित: (2021)

Weighted QMIX: Expanding monotonic value function factorisation for deep multi−agent reinforcement learning
द्वारा: Rashid, T, और अन्य
प्रकाशित: (2020)

A survey of reinforcement learning informed by natural language
द्वारा: Luketina, J, और अन्य
प्रकाशित: (2019)

UMPSA Edutourism Programme offers learning opportunities while travelling
द्वारा: Nor Salwana, Mohammad Idris
प्रकाशित: (2024)