OFFER: Off-environment reinforcement learning

Policy gradient methods have been widely applied in reinforcement learning. For reasons of safety and cost, learning is often conducted using a simulator. However, learning in simulation does not traditionally utilise the opportunity to improve learning by adjusting certain environment variables - s...

詳細記述

書誌詳細
主要な著者:	Ciosek, K, Whiteson, S
フォーマット:	Conference item
言語:	English
出版事項:	AAAI Press 2017

OFFER: Off-environment reinforcement learning

類似資料