VariBAD: variational bayes-adaptive deep RL via meta-learning

VariBAD: variational bayes-adaptive deep RL via meta-learning

Trading off exploration and exploitation in an unknown environment is key to maximising expected online return during learning. A Bayes-optimal policy, which does so optimally, conditions its actions not only on the environment state but also on the agent's uncertainty about the environment. Co...

সম্পূর্ণ বিবরণ

গ্রন্থ-পঞ্জীর বিবরন
প্রধান লেখক:	Whiteson, S
বিন্যাস:	Journal article
ভাষা:	English
প্রকাশিত:	Journal of Machine Learning Research 2021

অনুরূপ উপাদানগুলি

VariBAD: a very good method for Bayes-adaptive deep RL via meta-learning
অনুযায়ী: Zintgraf, L, অন্যান্য
প্রকাশিত: (2020)

Knowledge Transfer in Deep Reinforcement Learning via an RL-Specific GAN-Based Correspondence Function
অনুযায়ী: Marko Ruman, অন্যান্য
প্রকাশিত: (2024-01-01)

PharmRL: pharmacophore elucidation with deep geometric reinforcement learning
অনুযায়ী: Rishal Aggarwal, অন্যান্য
প্রকাশিত: (2024-12-01)

Fast Context Adaptation via Meta-Learning
অনুযায়ী: Zintgraf, L, অন্যান্য
প্রকাশিত: (2019)

Experience Replay Optimisation via ATSC and TSC for Performance Stability in Deep RL
অনুযায়ী: Richard Sakyi Osei, অন্যান্য
প্রকাশিত: (2023-02-01)

AC-RL: A Framework for Real-Time Control, Learning & Adaptation
অনুযায়ী: Guha, Anubhav
প্রকাশিত: (2023)

Learning to Utilize Curiosity: A New Approach of Automatic Curriculum Learning for Deep RL
অনুযায়ী: Zeyang Lin, অন্যান্য
প্রকাশিত: (2022-07-01)

RobustAnalog: Fast Variation-Aware Analog Circuit Design Via Multi-task RL
অনুযায়ী: Shi, Wei, অন্যান্য
প্রকাশিত: (2022)

Fiber Bundle Meta-learning Algorithm Based on Variational Bayes
অনুযায়ী: LIU Yang, LI Fan-zhang
প্রকাশিত: (2022-03-01)

Reinforcement learning (RL) based stock trading system via support vector machine
অনুযায়ী: Ong, Zhi Yuan.
প্রকাশিত: (2010)

GenFedRL: a general federated reinforcement learning framework for deep reinforcement learning agents
অনুযায়ী: Biao JIN, অন্যান্য
প্রকাশিত: (2023-06-01)

GenFedRL: a general federated reinforcement learning framework for deep reinforcement learning agents
অনুযায়ী: Biao JIN, অন্যান্য
প্রকাশিত: (2023-06-01)

Time-in-action RL
অনুযায়ী: Jiangcheng Zhu, অন্যান্য
প্রকাশিত: (2019-02-01)

RL-ANC: Reinforcement Learning-Based Adaptive Network Coding in the Ocean Mobile Internet of Things
অনুযায়ী: Ying Zhang, অন্যান্য
প্রকাশিত: (2024-06-01)

RL-AKF: An Adaptive Kalman Filter Navigation Algorithm Based on Reinforcement Learning for Ground Vehicles
অনুযায়ী: Xile Gao, অন্যান্য
প্রকাশিত: (2020-05-01)

Exploiting multiple abstractions in episodic RL via reward shaping
অনুযায়ী: Cipollone, R, অন্যান্য
প্রকাশিত: (2023)

Deep variational reinforcement learning for POMDPs
অনুযায়ী: Igl, M, অন্যান্য
প্রকাশিত: (2018)

rl4dtn: Q-Learning for Opportunistic Networks
অনুযায়ী: Jorge Visca, অন্যান্য
প্রকাশিত: (2022-11-01)

ACC-RL: Adaptive Congestion Control Based on Reinforcement Learning in Power Distribution Networks with Data Centers
অনুযায়ী: Tairan Huang, অন্যান্য
প্রকাশিত: (2023-07-01)

RL-SPIHT: Reinforcement Learning-Based Adaptive Selection of Compression Ratios for 1-D SPIHT Algorithm
অনুযায়ী: Jin Shin, অন্যান্য
প্রকাশিত: (2021-01-01)

RL-QPSO net: deep reinforcement learning-enhanced QPSO for efficient mobile robot path planning
অনুযায়ী: Yang Jing, অন্যান্য
প্রকাশিত: (2025-01-01)

iADA*-RL: Anytime Graph-Based Path Planning with Deep Reinforcement Learning for an Autonomous UAV
অনুযায়ী: Aye Aye Maw, অন্যান্য
প্রকাশিত: (2021-04-01)

Reflections of RL in The Virtual World
অনুযায়ী: Andra Siibak
প্রকাশিত: (2007-11-01)

Elimination of All Bad Local Minima in Deep Learning
অনুযায়ী: Kawaguchi, Kenji, অন্যান্য
প্রকাশিত: (2021)

Automation of digital crime investigation using Reinforcement Learning (RL)
অনুযায়ী: Ghanem, Mohamed Chahine
প্রকাশিত: (2023)

RL4CEP: reinforcement learning for updating CEP rules
অনুযায়ী: Afef Mdhaffar, অন্যান্য
প্রকাশিত: (2025-01-01)

CST-RL: Contrastive Spatio-Temporal Representations for Reinforcement Learning
অনুযায়ী: Chi-Kai Ho, অন্যান্য
প্রকাশিত: (2023-01-01)

ADAS-RL: Safety learning approach for stable autonomous driving
অনুযায়ী: Dongsu Lee, অন্যান্য
প্রকাশিত: (2022-09-01)

HLifeRL: A hierarchical lifelong reinforcement learning framework
অনুযায়ী: Fan Ding, অন্যান্য
প্রকাশিত: (2022-07-01)

RL-CWtrans Net: multimodal swimming coaching driven via robot vision
অনুযায়ী: Guanlin Wang
প্রকাশিত: (2024-08-01)

Improving Student Learning Outcomes Through the TaRL Learning Model on Discussion
অনুযায়ী: Miftahunajah Aditiya Pratama
প্রকাশিত: (2023-11-01)

Implementation of the TaRL Approach to Increase Student Learning Motivation in Physics Learning
অনুযায়ী: Melinda Cahya Ningrum Ningrum, অন্যান্য
প্রকাশিত: (2023-05-01)

Model-based RL in ATARI games
অনুযায়ী: Akarapu, Bharadwaj
প্রকাশিত: (2021)

Information asymmetry in KL-regularized RL
অনুযায়ী: Galashov, A, অন্যান্য
প্রকাশিত: (2018)

Model-Free RL or Action Sequences?
অনুযায়ী: Adam Morris, অন্যান্য
প্রকাশিত: (2019-12-01)

R.L. Moore : mathematician and teacher /
অনুযায়ী: 236772 Parker, John
প্রকাশিত: (2005)

Packet Size-Aware Broadcasting in VANETs With Fuzzy Logic and RL-Based Parameter Adaptation
অনুযায়ী: Celimuge Wu, অন্যান্য
প্রকাশিত: (2015-01-01)

RAMBO-RL: robust adversarial model-based offline reinforcement learning
অনুযায়ী: Rigter, M, অন্যান্য
প্রকাশিত: (2023)

SpaceRL — A reinforcement learning-based knowledge graph driver
অনুযায়ী: Miguel Bermudo, অন্যান্য
প্রকাশিত: (2025-05-01)

FleetRL: Realistic reinforcement learning environments for commercial vehicle fleets
অনুযায়ী: Enzo Cording, অন্যান্য
প্রকাশিত: (2024-05-01)