Deep variational reinforcement learning for POMDPs

Deep variational reinforcement learning for POMDPs

Many real-world sequential decision making problems are partially observable by nature, and the environment model is typically unknown. Consequently, there is great need for reinforcement learning methods that can tackle such problems given only a stream of incomplete and noisy observations. In this...

Deskribapen osoa

Xehetasun bibliografikoak
Egile Nagusiak:	Igl, M, Zintgraf, L, Le, T, Wood, F, Whiteson, S
Formatua:	Conference item
Argitaratua:	Journal of Machine Learning Research 2018

Antzeko izenburuak

Exploration in approximate hyper-state space for meta reinforcement learning
nork: Zintgraf, L, et al.
Argitaratua: (2021)

Reinforcement learning with limited reinforcement: Using Bayes risk for active learning in POMDPs
nork: Pineau, Joelle, et al.
Argitaratua: (2017)

VariBAD: a very good method for Bayes-adaptive deep RL via meta-learning
nork: Zintgraf, L, et al.
Argitaratua: (2020)

Multi-Agent Active Perception Based on Reinforcement Learning and POMDP
nork: Tarik Selimovic, et al.
Argitaratua: (2024-01-01)

TreeQN and ATreeC: differentiable tree planning for deep reinforcement learning
nork: Farquhar, G, et al.
Argitaratua: (2018)

Transient non−stationarity and generalisation in deep reinforcement learning
nork: Igl, M, et al.
Argitaratua: (2021)

Incremental Clustering and Expansion for Faster Optimal Planning in Dec-POMDPs
nork: Oliehoek, Frans A., et al.
Argitaratua: (2013)

Stick-breaking policy learning in Dec-POMDPs
nork: Amato, Christopher, et al.
Argitaratua: (2016)

Inductive biases and generalisation for deep reinforcement learning
nork: Igl, M
Argitaratua: (2021)

Fast adaptation via meta reinforcement learning
nork: Zintgraf, L
Argitaratua: (2022)

An online algorithm for constrained POMDPs
nork: Undurti, Aditya, et al.
Argitaratua: (2011)

Improved Deep Recurrent Q-Network of POMDPs for Automated Penetration Testing
nork: Yue Zhang, et al.
Argitaratua: (2022-10-01)

Monte-Carlo planning in large POMDPs
nork: Silver, David, et al.
Argitaratua: (2015)

Planning with Macro-Actions in Decentralized POMDPs
nork: Amato, Christopher, et al.
Argitaratua: (2016)

RAO*: an Algorithm for Chance-Constrained POMDP’s
nork: Santana, Pedro, et al.
Argitaratua: (2016)

Safe POMDP online planning via shielding
nork: Sheng, S, et al.
Argitaratua: (2024)

Modeling and Planning with Macro-Actions in Decentralized POMDPs
nork: Amato, Christopher, et al.
Argitaratua: (2021)

Sampling-based algorithms for continuous-time POMDPs
nork: Chaudhari, Pratik Anil, et al.
Argitaratua: (2013)

Trust oriented decision making via POMDPs
nork: Aravazhi Irissappane, Athirai
Argitaratua: (2016)

Policy Evaluation in Decentralized POMDPs With Belief Sharing
nork: Mert Kayaalp, et al.
Argitaratua: (2023-01-01)

DGA domain detection and botnet prevention using Q-learning for POMDP
nork: Y. V. Bubnov, et al.
Argitaratua: (2021-03-01)

Policy Improvement for POMDPs Using Normalized Importance Sampling
nork: Shelton, Christian R.
Argitaratua: (2004)

Spatial and Temporal Abstractions in POMDPs Applied to Robot Navigation
nork: Theocharous, Georgios, et al.
Argitaratua: (2005)

A POMDP Approach to Map Victims in Disaster Scenarios
nork: Pedro Gabriel Villani, et al.
Argitaratua: (2024-11-01)

Spectrum Access Algoritbm Based on POMDP Model in CVANET
nork: Xuefei Zhang, et al.
Argitaratua: (2014-09-01)

Spectrum Access Algoritbm Based on POMDP Model in CVANET
nork: Xuefei Zhang, et al.
Argitaratua: (2014-09-01)

Bottom-up learning of hierarchical models in a class of deterministic POMDP environments
nork: Itoh Hideaki, et al.
Argitaratua: (2015-09-01)

Deep residual reinforcement learning
nork: Zhang, S, et al.
Argitaratua: (2020)

Efficient POMDP Forward Search by Predicting the Posterior Belief Distribution
nork: Roy, Nicholas, et al.
Argitaratua: (2009)

Interference Coordination Based on POMDP in Multi-Cell OFDMA System
nork: Qiang Wei, et al.
Argitaratua: (2013-04-01)

Cognitive radio auto-adaptive sensing algorithm based on POMDP
nork: Rui-chen XU, et al.
Argitaratua: (2013-06-01)

Interference Coordination Based on POMDP in Multi-Cell OFDMA System
nork: Qiang Wei, et al.
Argitaratua: (2013-04-01)

Cognitive radio auto-adaptive sensing algorithm based on POMDP
nork: Rui-chen XU, et al.
Argitaratua: (2013-06-01)

Point-Based Policy Transformation: Adapting Policy to Changing POMDP Models
nork: Kurniawati, Hanna, et al.
Argitaratua: (2019)

Recent Advances in Deep Reinforcement Learning Applications for Solving Partially Observable Markov Decision Processes (POMDP) Problems Part 2—Applications in Transportation, Industries, Communications and Networking and More Topics
nork: Xuanchen Xiang, et al.
Argitaratua: (2021-10-01)

Recent Advances in Deep Reinforcement Learning Applications for Solving Partially Observable Markov Decision Processes (POMDP) Problems: Part 1—Fundamentals and Applications in Games, Robotics and Natural Language Processing
nork: Xuanchen Xiang, et al.
Argitaratua: (2021-07-01)

CAR-DESPOT: causally-informed online POMDP planning for robots in confounded environments
nork: Cannizzaro, R, et al.
Argitaratua: (2023)

DualSMC: Tunneling Differentiable Filtering and Planning under Continuous POMDPs
nork: Wang, Yunbo, et al.
Argitaratua: (2021)

Personalized Cotesting Policies for Cervical Cancer Screening: A POMDP Approach
nork: Malek Ebadi, et al.
Argitaratua: (2021-03-01)

A POMDP Framework for Coordinated Guidance of Autonomous UAVs for Multitarget Tracking
Argitaratua: (2009-03-01)