Invariant causal prediction for block MDPs
Generalization across environments is critical to the successful application of reinforcement learning (RL) algorithms to real-world challenges. In this work we propose a method for learning state abstractions which generalize to novel observation distributions in the multi-environment RL setting. W...
প্রধান লেখক: | Zhang, A, Lyle, C, Sodhani, S, Filos, A, Kwiatkowska, M, Pineau, J, Gal, Y, Precup, D |
---|---|
বিন্যাস: | Conference item |
ভাষা: | English |
প্রকাশিত: |
Proceedings of Machine Learning Research
2020
|
অনুরূপ উপাদানগুলি
অনুরূপ উপাদানগুলি
-
Markov decision processes in artificial intelligence : MDPs, beyond MDPs and applications /
অনুযায়ী: Sigaud, Olivier, অন্যান্য
প্রকাশিত: (2010) -
Transience in countable MDPs
অনুযায়ী: Kiefer, SM, অন্যান্য
প্রকাশিত: (2021) -
Parity objectives in countable MDPs
অনুযায়ী: Kiefer, S, অন্যান্য
প্রকাশিত: (2017) -
Büchi objectives in countable MDPs
অনুযায়ী: Kiefer, S, অন্যান্য
প্রকাশিত: (2019) -
Social Interactions as Recursive MDPs
অনুযায়ী: Tejwani, Ravi, অন্যান্য
প্রকাশিত: (2022)