VariBAD: variational bayes-adaptive deep RL via meta-learning

VariBAD: variational bayes-adaptive deep RL via meta-learning

Trading off exploration and exploitation in an unknown environment is key to maximising expected online return during learning. A Bayes-optimal policy, which does so optimally, conditions its actions not only on the environment state but also on the agent's uncertainty about the environment. Co...

وصف كامل

التفاصيل البيبلوغرافية
المؤلف الرئيسي:	Whiteson, S
التنسيق:	Journal article
اللغة:	English
منشور في:	Journal of Machine Learning Research 2021

مواد مشابهة

VariBAD: a very good method for Bayes-adaptive deep RL via meta-learning
حسب: Zintgraf, L, وآخرون
منشور في: (2020)

Knowledge Transfer in Deep Reinforcement Learning via an RL-Specific GAN-Based Correspondence Function
حسب: Marko Ruman, وآخرون
منشور في: (2024-01-01)

PharmRL: pharmacophore elucidation with deep geometric reinforcement learning
حسب: Rishal Aggarwal, وآخرون
منشور في: (2024-12-01)

Fast Context Adaptation via Meta-Learning
حسب: Zintgraf, L, وآخرون
منشور في: (2019)

Experience Replay Optimisation via ATSC and TSC for Performance Stability in Deep RL
حسب: Richard Sakyi Osei, وآخرون
منشور في: (2023-02-01)

AC-RL: A Framework for Real-Time Control, Learning & Adaptation
حسب: Guha, Anubhav
منشور في: (2023)

Learning to Utilize Curiosity: A New Approach of Automatic Curriculum Learning for Deep RL
حسب: Zeyang Lin, وآخرون
منشور في: (2022-07-01)

RobustAnalog: Fast Variation-Aware Analog Circuit Design Via Multi-task RL
حسب: Shi, Wei, وآخرون
منشور في: (2022)

Fiber Bundle Meta-learning Algorithm Based on Variational Bayes
حسب: LIU Yang, LI Fan-zhang
منشور في: (2022-03-01)

Reinforcement learning (RL) based stock trading system via support vector machine
حسب: Ong, Zhi Yuan.
منشور في: (2010)

GenFedRL: a general federated reinforcement learning framework for deep reinforcement learning agents
حسب: Biao JIN, وآخرون
منشور في: (2023-06-01)

GenFedRL: a general federated reinforcement learning framework for deep reinforcement learning agents
حسب: Biao JIN, وآخرون
منشور في: (2023-06-01)

Time-in-action RL
حسب: Jiangcheng Zhu, وآخرون
منشور في: (2019-02-01)

RL-ANC: Reinforcement Learning-Based Adaptive Network Coding in the Ocean Mobile Internet of Things
حسب: Ying Zhang, وآخرون
منشور في: (2024-06-01)

RL-AKF: An Adaptive Kalman Filter Navigation Algorithm Based on Reinforcement Learning for Ground Vehicles
حسب: Xile Gao, وآخرون
منشور في: (2020-05-01)

Exploiting multiple abstractions in episodic RL via reward shaping
حسب: Cipollone, R, وآخرون
منشور في: (2023)

Deep variational reinforcement learning for POMDPs
حسب: Igl, M, وآخرون
منشور في: (2018)

rl4dtn: Q-Learning for Opportunistic Networks
حسب: Jorge Visca, وآخرون
منشور في: (2022-11-01)

ACC-RL: Adaptive Congestion Control Based on Reinforcement Learning in Power Distribution Networks with Data Centers
حسب: Tairan Huang, وآخرون
منشور في: (2023-07-01)

RL-SPIHT: Reinforcement Learning-Based Adaptive Selection of Compression Ratios for 1-D SPIHT Algorithm
حسب: Jin Shin, وآخرون
منشور في: (2021-01-01)

RL-QPSO net: deep reinforcement learning-enhanced QPSO for efficient mobile robot path planning
حسب: Yang Jing, وآخرون
منشور في: (2025-01-01)

iADA*-RL: Anytime Graph-Based Path Planning with Deep Reinforcement Learning for an Autonomous UAV
حسب: Aye Aye Maw, وآخرون
منشور في: (2021-04-01)

Reflections of RL in The Virtual World
حسب: Andra Siibak
منشور في: (2007-11-01)

Elimination of All Bad Local Minima in Deep Learning
حسب: Kawaguchi, Kenji, وآخرون
منشور في: (2021)

Automation of digital crime investigation using Reinforcement Learning (RL)
حسب: Ghanem, Mohamed Chahine
منشور في: (2023)

RL4CEP: reinforcement learning for updating CEP rules
حسب: Afef Mdhaffar, وآخرون
منشور في: (2025-01-01)

CST-RL: Contrastive Spatio-Temporal Representations for Reinforcement Learning
حسب: Chi-Kai Ho, وآخرون
منشور في: (2023-01-01)

ADAS-RL: Safety learning approach for stable autonomous driving
حسب: Dongsu Lee, وآخرون
منشور في: (2022-09-01)

HLifeRL: A hierarchical lifelong reinforcement learning framework
حسب: Fan Ding, وآخرون
منشور في: (2022-07-01)

RL-CWtrans Net: multimodal swimming coaching driven via robot vision
حسب: Guanlin Wang
منشور في: (2024-08-01)

Improving Student Learning Outcomes Through the TaRL Learning Model on Discussion
حسب: Miftahunajah Aditiya Pratama
منشور في: (2023-11-01)

Implementation of the TaRL Approach to Increase Student Learning Motivation in Physics Learning
حسب: Melinda Cahya Ningrum Ningrum, وآخرون
منشور في: (2023-05-01)

Model-based RL in ATARI games
حسب: Akarapu, Bharadwaj
منشور في: (2021)

Information asymmetry in KL-regularized RL
حسب: Galashov, A, وآخرون
منشور في: (2018)

Model-Free RL or Action Sequences?
حسب: Adam Morris, وآخرون
منشور في: (2019-12-01)

R.L. Moore : mathematician and teacher /
حسب: 236772 Parker, John
منشور في: (2005)

Packet Size-Aware Broadcasting in VANETs With Fuzzy Logic and RL-Based Parameter Adaptation
حسب: Celimuge Wu, وآخرون
منشور في: (2015-01-01)

RAMBO-RL: robust adversarial model-based offline reinforcement learning
حسب: Rigter, M, وآخرون
منشور في: (2023)

SpaceRL — A reinforcement learning-based knowledge graph driver
حسب: Miguel Bermudo, وآخرون
منشور في: (2025-05-01)

FleetRL: Realistic reinforcement learning environments for commercial vehicle fleets
حسب: Enzo Cording, وآخرون
منشور في: (2024-05-01)