Deep variational reinforcement learning for POMDPs

Deep variational reinforcement learning for POMDPs

Many real-world sequential decision making problems are partially observable by nature, and the environment model is typically unknown. Consequently, there is great need for reinforcement learning methods that can tackle such problems given only a stream of incomplete and noisy observations. In this...

Повний опис

Бібліографічні деталі
Автори:	Igl, M, Zintgraf, L, Le, T, Wood, F, Whiteson, S
Формат:	Conference item
Опубліковано:	Journal of Machine Learning Research 2018

Схожі ресурси

Exploration in approximate hyper-state space for meta reinforcement learning
за авторством: Zintgraf, L, та інші
Опубліковано: (2021)

Reinforcement learning with limited reinforcement: Using Bayes risk for active learning in POMDPs
за авторством: Pineau, Joelle, та інші
Опубліковано: (2017)

VariBAD: a very good method for Bayes-adaptive deep RL via meta-learning
за авторством: Zintgraf, L, та інші
Опубліковано: (2020)

Multi-Agent Active Perception Based on Reinforcement Learning and POMDP
за авторством: Tarik Selimovic, та інші
Опубліковано: (2024-01-01)

TreeQN and ATreeC: differentiable tree planning for deep reinforcement learning
за авторством: Farquhar, G, та інші
Опубліковано: (2018)

Transient non−stationarity and generalisation in deep reinforcement learning
за авторством: Igl, M, та інші
Опубліковано: (2021)

Incremental Clustering and Expansion for Faster Optimal Planning in Dec-POMDPs
за авторством: Oliehoek, Frans A., та інші
Опубліковано: (2013)

Stick-breaking policy learning in Dec-POMDPs
за авторством: Amato, Christopher, та інші
Опубліковано: (2016)

Inductive biases and generalisation for deep reinforcement learning
за авторством: Igl, M
Опубліковано: (2021)

Fast adaptation via meta reinforcement learning
за авторством: Zintgraf, L
Опубліковано: (2022)

An online algorithm for constrained POMDPs
за авторством: Undurti, Aditya, та інші
Опубліковано: (2011)

Improved Deep Recurrent Q-Network of POMDPs for Automated Penetration Testing
за авторством: Yue Zhang, та інші
Опубліковано: (2022-10-01)

Monte-Carlo planning in large POMDPs
за авторством: Silver, David, та інші
Опубліковано: (2015)

Planning with Macro-Actions in Decentralized POMDPs
за авторством: Amato, Christopher, та інші
Опубліковано: (2016)

RAO*: an Algorithm for Chance-Constrained POMDP’s
за авторством: Santana, Pedro, та інші
Опубліковано: (2016)

Safe POMDP online planning via shielding
за авторством: Sheng, S, та інші
Опубліковано: (2024)

Modeling and Planning with Macro-Actions in Decentralized POMDPs
за авторством: Amato, Christopher, та інші
Опубліковано: (2021)

Sampling-based algorithms for continuous-time POMDPs
за авторством: Chaudhari, Pratik Anil, та інші
Опубліковано: (2013)

Trust oriented decision making via POMDPs
за авторством: Aravazhi Irissappane, Athirai
Опубліковано: (2016)

Policy Evaluation in Decentralized POMDPs With Belief Sharing
за авторством: Mert Kayaalp, та інші
Опубліковано: (2023-01-01)

DGA domain detection and botnet prevention using Q-learning for POMDP
за авторством: Y. V. Bubnov, та інші
Опубліковано: (2021-03-01)

Policy Improvement for POMDPs Using Normalized Importance Sampling
за авторством: Shelton, Christian R.
Опубліковано: (2004)

Spatial and Temporal Abstractions in POMDPs Applied to Robot Navigation
за авторством: Theocharous, Georgios, та інші
Опубліковано: (2005)

A POMDP Approach to Map Victims in Disaster Scenarios
за авторством: Pedro Gabriel Villani, та інші
Опубліковано: (2024-11-01)

Spectrum Access Algoritbm Based on POMDP Model in CVANET
за авторством: Xuefei Zhang, та інші
Опубліковано: (2014-09-01)

Spectrum Access Algoritbm Based on POMDP Model in CVANET
за авторством: Xuefei Zhang, та інші
Опубліковано: (2014-09-01)

Bottom-up learning of hierarchical models in a class of deterministic POMDP environments
за авторством: Itoh Hideaki, та інші
Опубліковано: (2015-09-01)

Deep residual reinforcement learning
за авторством: Zhang, S, та інші
Опубліковано: (2020)

Efficient POMDP Forward Search by Predicting the Posterior Belief Distribution
за авторством: Roy, Nicholas, та інші
Опубліковано: (2009)

Interference Coordination Based on POMDP in Multi-Cell OFDMA System
за авторством: Qiang Wei, та інші
Опубліковано: (2013-04-01)

Cognitive radio auto-adaptive sensing algorithm based on POMDP
за авторством: Rui-chen XU, та інші
Опубліковано: (2013-06-01)

Interference Coordination Based on POMDP in Multi-Cell OFDMA System
за авторством: Qiang Wei, та інші
Опубліковано: (2013-04-01)

Cognitive radio auto-adaptive sensing algorithm based on POMDP
за авторством: Rui-chen XU, та інші
Опубліковано: (2013-06-01)

Point-Based Policy Transformation: Adapting Policy to Changing POMDP Models
за авторством: Kurniawati, Hanna, та інші
Опубліковано: (2019)

Recent Advances in Deep Reinforcement Learning Applications for Solving Partially Observable Markov Decision Processes (POMDP) Problems Part 2—Applications in Transportation, Industries, Communications and Networking and More Topics
за авторством: Xuanchen Xiang, та інші
Опубліковано: (2021-10-01)

Recent Advances in Deep Reinforcement Learning Applications for Solving Partially Observable Markov Decision Processes (POMDP) Problems: Part 1—Fundamentals and Applications in Games, Robotics and Natural Language Processing
за авторством: Xuanchen Xiang, та інші
Опубліковано: (2021-07-01)

CAR-DESPOT: causally-informed online POMDP planning for robots in confounded environments
за авторством: Cannizzaro, R, та інші
Опубліковано: (2023)

DualSMC: Tunneling Differentiable Filtering and Planning under Continuous POMDPs
за авторством: Wang, Yunbo, та інші
Опубліковано: (2021)

Personalized Cotesting Policies for Cervical Cancer Screening: A POMDP Approach
за авторством: Malek Ebadi, та інші
Опубліковано: (2021-03-01)

A POMDP Framework for Coordinated Guidance of Autonomous UAVs for Multitarget Tracking
Опубліковано: (2009-03-01)