Deep variational reinforcement learning for POMDPs

Deep variational reinforcement learning for POMDPs

Many real-world sequential decision making problems are partially observable by nature, and the environment model is typically unknown. Consequently, there is great need for reinforcement learning methods that can tackle such problems given only a stream of incomplete and noisy observations. In this...

ver descrição completa

Detalhes bibliográficos
Main Authors:	Igl, M, Zintgraf, L, Le, T, Wood, F, Whiteson, S
Formato:	Conference item
Publicado em:	Journal of Machine Learning Research 2018

Registos relacionados

Exploration in approximate hyper-state space for meta reinforcement learning
Por: Zintgraf, L, et al.
Publicado em: (2021)

Reinforcement learning with limited reinforcement: Using Bayes risk for active learning in POMDPs
Por: Pineau, Joelle, et al.
Publicado em: (2017)

VariBAD: a very good method for Bayes-adaptive deep RL via meta-learning
Por: Zintgraf, L, et al.
Publicado em: (2020)

Multi-Agent Active Perception Based on Reinforcement Learning and POMDP
Por: Tarik Selimovic, et al.
Publicado em: (2024-01-01)

TreeQN and ATreeC: differentiable tree planning for deep reinforcement learning
Por: Farquhar, G, et al.
Publicado em: (2018)

Transient non−stationarity and generalisation in deep reinforcement learning
Por: Igl, M, et al.
Publicado em: (2021)

Incremental Clustering and Expansion for Faster Optimal Planning in Dec-POMDPs
Por: Oliehoek, Frans A., et al.
Publicado em: (2013)

Stick-breaking policy learning in Dec-POMDPs
Por: Amato, Christopher, et al.
Publicado em: (2016)

Inductive biases and generalisation for deep reinforcement learning
Por: Igl, M
Publicado em: (2021)

Fast adaptation via meta reinforcement learning
Por: Zintgraf, L
Publicado em: (2022)

An online algorithm for constrained POMDPs
Por: Undurti, Aditya, et al.
Publicado em: (2011)

Improved Deep Recurrent Q-Network of POMDPs for Automated Penetration Testing
Por: Yue Zhang, et al.
Publicado em: (2022-10-01)

Monte-Carlo planning in large POMDPs
Por: Silver, David, et al.
Publicado em: (2015)

Planning with Macro-Actions in Decentralized POMDPs
Por: Amato, Christopher, et al.
Publicado em: (2016)

RAO*: an Algorithm for Chance-Constrained POMDP’s
Por: Santana, Pedro, et al.
Publicado em: (2016)

Safe POMDP online planning via shielding
Por: Sheng, S, et al.
Publicado em: (2024)

Modeling and Planning with Macro-Actions in Decentralized POMDPs
Por: Amato, Christopher, et al.
Publicado em: (2021)

Sampling-based algorithms for continuous-time POMDPs
Por: Chaudhari, Pratik Anil, et al.
Publicado em: (2013)

Trust oriented decision making via POMDPs
Por: Aravazhi Irissappane, Athirai
Publicado em: (2016)

Policy Evaluation in Decentralized POMDPs With Belief Sharing
Por: Mert Kayaalp, et al.
Publicado em: (2023-01-01)

DGA domain detection and botnet prevention using Q-learning for POMDP
Por: Y. V. Bubnov, et al.
Publicado em: (2021-03-01)

Policy Improvement for POMDPs Using Normalized Importance Sampling
Por: Shelton, Christian R.
Publicado em: (2004)

Spatial and Temporal Abstractions in POMDPs Applied to Robot Navigation
Por: Theocharous, Georgios, et al.
Publicado em: (2005)

A POMDP Approach to Map Victims in Disaster Scenarios
Por: Pedro Gabriel Villani, et al.
Publicado em: (2024-11-01)

Spectrum Access Algoritbm Based on POMDP Model in CVANET
Por: Xuefei Zhang, et al.
Publicado em: (2014-09-01)

Spectrum Access Algoritbm Based on POMDP Model in CVANET
Por: Xuefei Zhang, et al.
Publicado em: (2014-09-01)

Bottom-up learning of hierarchical models in a class of deterministic POMDP environments
Por: Itoh Hideaki, et al.
Publicado em: (2015-09-01)

Deep residual reinforcement learning
Por: Zhang, S, et al.
Publicado em: (2020)

Efficient POMDP Forward Search by Predicting the Posterior Belief Distribution
Por: Roy, Nicholas, et al.
Publicado em: (2009)

Interference Coordination Based on POMDP in Multi-Cell OFDMA System
Por: Qiang Wei, et al.
Publicado em: (2013-04-01)

Cognitive radio auto-adaptive sensing algorithm based on POMDP
Por: Rui-chen XU, et al.
Publicado em: (2013-06-01)

Interference Coordination Based on POMDP in Multi-Cell OFDMA System
Por: Qiang Wei, et al.
Publicado em: (2013-04-01)

Cognitive radio auto-adaptive sensing algorithm based on POMDP
Por: Rui-chen XU, et al.
Publicado em: (2013-06-01)

Point-Based Policy Transformation: Adapting Policy to Changing POMDP Models
Por: Kurniawati, Hanna, et al.
Publicado em: (2019)

Recent Advances in Deep Reinforcement Learning Applications for Solving Partially Observable Markov Decision Processes (POMDP) Problems Part 2—Applications in Transportation, Industries, Communications and Networking and More Topics
Por: Xuanchen Xiang, et al.
Publicado em: (2021-10-01)

Recent Advances in Deep Reinforcement Learning Applications for Solving Partially Observable Markov Decision Processes (POMDP) Problems: Part 1—Fundamentals and Applications in Games, Robotics and Natural Language Processing
Por: Xuanchen Xiang, et al.
Publicado em: (2021-07-01)

CAR-DESPOT: causally-informed online POMDP planning for robots in confounded environments
Por: Cannizzaro, R, et al.
Publicado em: (2023)

DualSMC: Tunneling Differentiable Filtering and Planning under Continuous POMDPs
Por: Wang, Yunbo, et al.
Publicado em: (2021)

Personalized Cotesting Policies for Cervical Cancer Screening: A POMDP Approach
Por: Malek Ebadi, et al.
Publicado em: (2021-03-01)

A POMDP Framework for Coordinated Guidance of Autonomous UAVs for Multitarget Tracking
Publicado em: (2009-03-01)