Efficient POMDP Forward Search by Predicting the Posterior Belief Distribution
Online, forward-search techniques have demonstrated promising results for solving problems in partially observable environments. These techniques depend on the ability to efficiently search and evaluate the set of beliefs reachable from the current belief. However, enumerating or sampling action-obs...
প্রধান লেখক: | Roy, Nicholas, He, Ruijie |
---|---|
অন্যান্য লেখক: | Nicholas Roy |
প্রকাশিত: |
2009
|
অনলাইন ব্যবহার করুন: | http://hdl.handle.net/1721.1/46820 |
অনুরূপ উপাদানগুলি
-
An online algorithm for constrained POMDPs
অনুযায়ী: Undurti, Aditya, অন্যান্য
প্রকাশিত: (2011) -
Reinforcement learning with limited reinforcement: Using Bayes risk for active learning in POMDPs
অনুযায়ী: Pineau, Joelle, অন্যান্য
প্রকাশিত: (2017) -
Monte-Carlo planning in large POMDPs
অনুযায়ী: Silver, David, অন্যান্য
প্রকাশিত: (2015) -
Planning with Macro-Actions in Decentralized POMDPs
অনুযায়ী: Amato, Christopher, অন্যান্য
প্রকাশিত: (2016) -
RAO*: an Algorithm for Chance-Constrained POMDP’s
অনুযায়ী: Santana, Pedro, অন্যান্য
প্রকাশিত: (2016)