Invariant causal prediction for block MDPs

Generalization across environments is critical to the successful application of reinforcement learning (RL) algorithms to real-world challenges. In this work we propose a method for learning state abstractions which generalize to novel observation distributions in the multi-environment RL setting. W...

Ամբողջական նկարագրություն

Մատենագիտական մանրամասներ
Հիմնական հեղինակներ:	Zhang, A, Lyle, C, Sodhani, S, Filos, A, Kwiatkowska, M, Pineau, J, Gal, Y, Precup, D
Ձևաչափ:	Conference item
Լեզու:	English
Հրապարակվել է:	Proceedings of Machine Learning Research 2020

Invariant causal prediction for block MDPs

Նմանատիպ նյութեր