Deep variational reinforcement learning for POMDPs

Deep variational reinforcement learning for POMDPs

Many real-world sequential decision making problems are partially observable by nature, and the environment model is typically unknown. Consequently, there is great need for reinforcement learning methods that can tackle such problems given only a stream of incomplete and noisy observations. In this...

Detaylı Bibliyografya
Asıl Yazarlar:	Igl, M, Zintgraf, L, Le, T, Wood, F, Whiteson, S
Materyal Türü:	Conference item
Baskı/Yayın Bilgisi:	Journal of Machine Learning Research 2018

Benzer Materyaller

Exploration in approximate hyper-state space for meta reinforcement learning
Yazar:: Zintgraf, L, ve diğerleri
Baskı/Yayın Bilgisi: (2021)

Reinforcement learning with limited reinforcement: Using Bayes risk for active learning in POMDPs
Yazar:: Pineau, Joelle, ve diğerleri
Baskı/Yayın Bilgisi: (2017)

VariBAD: a very good method for Bayes-adaptive deep RL via meta-learning
Yazar:: Zintgraf, L, ve diğerleri
Baskı/Yayın Bilgisi: (2020)

Multi-Agent Active Perception Based on Reinforcement Learning and POMDP
Yazar:: Tarik Selimovic, ve diğerleri
Baskı/Yayın Bilgisi: (2024-01-01)

TreeQN and ATreeC: differentiable tree planning for deep reinforcement learning
Yazar:: Farquhar, G, ve diğerleri
Baskı/Yayın Bilgisi: (2018)

Transient non−stationarity and generalisation in deep reinforcement learning
Yazar:: Igl, M, ve diğerleri
Baskı/Yayın Bilgisi: (2021)

Incremental Clustering and Expansion for Faster Optimal Planning in Dec-POMDPs
Yazar:: Oliehoek, Frans A., ve diğerleri
Baskı/Yayın Bilgisi: (2013)

Stick-breaking policy learning in Dec-POMDPs
Yazar:: Amato, Christopher, ve diğerleri
Baskı/Yayın Bilgisi: (2016)

Inductive biases and generalisation for deep reinforcement learning
Yazar:: Igl, M
Baskı/Yayın Bilgisi: (2021)

Fast adaptation via meta reinforcement learning
Yazar:: Zintgraf, L
Baskı/Yayın Bilgisi: (2022)

An online algorithm for constrained POMDPs
Yazar:: Undurti, Aditya, ve diğerleri
Baskı/Yayın Bilgisi: (2011)

Improved Deep Recurrent Q-Network of POMDPs for Automated Penetration Testing
Yazar:: Yue Zhang, ve diğerleri
Baskı/Yayın Bilgisi: (2022-10-01)

Monte-Carlo planning in large POMDPs
Yazar:: Silver, David, ve diğerleri
Baskı/Yayın Bilgisi: (2015)

Planning with Macro-Actions in Decentralized POMDPs
Yazar:: Amato, Christopher, ve diğerleri
Baskı/Yayın Bilgisi: (2016)

RAO*: an Algorithm for Chance-Constrained POMDP’s
Yazar:: Santana, Pedro, ve diğerleri
Baskı/Yayın Bilgisi: (2016)

Safe POMDP online planning via shielding
Yazar:: Sheng, S, ve diğerleri
Baskı/Yayın Bilgisi: (2024)

Modeling and Planning with Macro-Actions in Decentralized POMDPs
Yazar:: Amato, Christopher, ve diğerleri
Baskı/Yayın Bilgisi: (2021)

Sampling-based algorithms for continuous-time POMDPs
Yazar:: Chaudhari, Pratik Anil, ve diğerleri
Baskı/Yayın Bilgisi: (2013)

Trust oriented decision making via POMDPs
Yazar:: Aravazhi Irissappane, Athirai
Baskı/Yayın Bilgisi: (2016)

Policy Evaluation in Decentralized POMDPs With Belief Sharing
Yazar:: Mert Kayaalp, ve diğerleri
Baskı/Yayın Bilgisi: (2023-01-01)

DGA domain detection and botnet prevention using Q-learning for POMDP
Yazar:: Y. V. Bubnov, ve diğerleri
Baskı/Yayın Bilgisi: (2021-03-01)

Policy Improvement for POMDPs Using Normalized Importance Sampling
Yazar:: Shelton, Christian R.
Baskı/Yayın Bilgisi: (2004)

Spatial and Temporal Abstractions in POMDPs Applied to Robot Navigation
Yazar:: Theocharous, Georgios, ve diğerleri
Baskı/Yayın Bilgisi: (2005)

A POMDP Approach to Map Victims in Disaster Scenarios
Yazar:: Pedro Gabriel Villani, ve diğerleri
Baskı/Yayın Bilgisi: (2024-11-01)

Spectrum Access Algoritbm Based on POMDP Model in CVANET
Yazar:: Xuefei Zhang, ve diğerleri
Baskı/Yayın Bilgisi: (2014-09-01)

Spectrum Access Algoritbm Based on POMDP Model in CVANET
Yazar:: Xuefei Zhang, ve diğerleri
Baskı/Yayın Bilgisi: (2014-09-01)

Bottom-up learning of hierarchical models in a class of deterministic POMDP environments
Yazar:: Itoh Hideaki, ve diğerleri
Baskı/Yayın Bilgisi: (2015-09-01)

Deep residual reinforcement learning
Yazar:: Zhang, S, ve diğerleri
Baskı/Yayın Bilgisi: (2020)

Efficient POMDP Forward Search by Predicting the Posterior Belief Distribution
Yazar:: Roy, Nicholas, ve diğerleri
Baskı/Yayın Bilgisi: (2009)

Interference Coordination Based on POMDP in Multi-Cell OFDMA System
Yazar:: Qiang Wei, ve diğerleri
Baskı/Yayın Bilgisi: (2013-04-01)

Cognitive radio auto-adaptive sensing algorithm based on POMDP
Yazar:: Rui-chen XU, ve diğerleri
Baskı/Yayın Bilgisi: (2013-06-01)

Interference Coordination Based on POMDP in Multi-Cell OFDMA System
Yazar:: Qiang Wei, ve diğerleri
Baskı/Yayın Bilgisi: (2013-04-01)

Cognitive radio auto-adaptive sensing algorithm based on POMDP
Yazar:: Rui-chen XU, ve diğerleri
Baskı/Yayın Bilgisi: (2013-06-01)

Point-Based Policy Transformation: Adapting Policy to Changing POMDP Models
Yazar:: Kurniawati, Hanna, ve diğerleri
Baskı/Yayın Bilgisi: (2019)

Recent Advances in Deep Reinforcement Learning Applications for Solving Partially Observable Markov Decision Processes (POMDP) Problems Part 2—Applications in Transportation, Industries, Communications and Networking and More Topics
Yazar:: Xuanchen Xiang, ve diğerleri
Baskı/Yayın Bilgisi: (2021-10-01)

Recent Advances in Deep Reinforcement Learning Applications for Solving Partially Observable Markov Decision Processes (POMDP) Problems: Part 1—Fundamentals and Applications in Games, Robotics and Natural Language Processing
Yazar:: Xuanchen Xiang, ve diğerleri
Baskı/Yayın Bilgisi: (2021-07-01)

CAR-DESPOT: causally-informed online POMDP planning for robots in confounded environments
Yazar:: Cannizzaro, R, ve diğerleri
Baskı/Yayın Bilgisi: (2023)

DualSMC: Tunneling Differentiable Filtering and Planning under Continuous POMDPs
Yazar:: Wang, Yunbo, ve diğerleri
Baskı/Yayın Bilgisi: (2021)

Personalized Cotesting Policies for Cervical Cancer Screening: A POMDP Approach
Yazar:: Malek Ebadi, ve diğerleri
Baskı/Yayın Bilgisi: (2021-03-01)

A POMDP Framework for Coordinated Guidance of Autonomous UAVs for Multitarget Tracking
Baskı/Yayın Bilgisi: (2009-03-01)