Breaking the deadly triad in reinforcement learning

<p>Reinforcement Learning (RL) is a promising framework for solving sequential decision making problems emerging from agent-environment interactions via trial and error. Off-policy learning is one of the most important techniques in RL, which enables an RL agent to learn from agent-environment...

पूर्ण विवरण

ग्रंथसूची विवरण
मुख्य लेखक:	Zhang, S
अन्य लेखक:	Whiteson, S
स्वरूप:	थीसिस
भाषा:	English
प्रकाशित:	2022
विषय:	Artificial intelligence

Breaking the deadly triad in reinforcement learning

समान संसाधन