UneVEn: Universal value exploration for multi-agent reinforcement learning

UneVEn: Universal value exploration for multi-agent reinforcement learning

VDN and QMIX are two popular value-based algorithms for cooperative MARL that learn a centralized action value function as a monotonic mixing of per-agent utilities. While this enables easy decentralization of the learned policy, the restricted joint action value function can prevent them from solvi...

Detaylı Bibliyografya
Asıl Yazarlar:	Gupta, T, Mahajan, A, Peng, B, Boehmer, W, Whiteson, S
Materyal Türü:	Conference item
Dil:	English
Baskı/Yayın Bilgisi:	PMLR 2021

Benzer Materyaller

Randomized entity-wise factorization for multi-agent reinforcement learning
Yazar:: Iqbal, S, ve diğerleri
Baskı/Yayın Bilgisi: (2021)

Multi-agent common knowledge reinforcement learning
Yazar:: de Witt, C, ve diğerleri
Baskı/Yayın Bilgisi: (2019)

MAVEN: Multi-Agent Variational Exploration
Yazar:: Mahajan, A, ve diğerleri
Baskı/Yayın Bilgisi: (2019)

Weighted QMIX: Expanding monotonic value function factorisation for deep multi−agent reinforcement learning
Yazar:: Rashid, T, ve diğerleri
Baskı/Yayın Bilgisi: (2020)

Deep residual reinforcement learning
Yazar:: Zhang, S, ve diğerleri
Baskı/Yayın Bilgisi: (2020)

Analysing factorizations of action-value networks for cooperative multi-agent reinforcement learning
Yazar:: Castellini, J, ve diğerleri
Baskı/Yayın Bilgisi: (2021)

Monotonic value function factorisation for deep multi-agent reinforcement learning
Yazar:: Rashid, T, ve diğerleri
Baskı/Yayın Bilgisi: (2020)

RODE: learning roles to decompose multi−agent tasks
Yazar:: Wang, T, ve diğerleri
Baskı/Yayın Bilgisi: (2021)

Bayesian action decoder for deep multi-agent reinforcement learning
Yazar:: Whiteson, S
Baskı/Yayın Bilgisi: (2019)

Tesseract: tensorised actors for multi−agent reinforcement learning
Yazar:: Mahajan, A, ve diğerleri
Baskı/Yayın Bilgisi: (2021)

QMIX: Monotonic value function factorisation for deep multi-agent reinforcement learning
Yazar:: Rashid, T, ve diğerleri
Baskı/Yayın Bilgisi: (2018)

Exploration and value function factorisation in single and multi-agent reinforcement learning
Yazar:: Rashid, T
Baskı/Yayın Bilgisi: (2021)

Learning to communicate with Deep multi-agent reinforcement learning
Yazar:: Foerster, J, ve diğerleri
Baskı/Yayın Bilgisi: (2016)

Rethinking Exploration and Experience Exploitation in Value-Based Multi-Agent Reinforcement Learning
Yazar:: Anatolii Borzilov, ve diğerleri
Baskı/Yayın Bilgisi: (2025-01-01)

LexVEN
Yazar:: Maria Ferin, ve diğerleri
Baskı/Yayın Bilgisi: (2023-10-01)

Stabilising experience replay for deep multi-agent reinforcement learning
Yazar:: Foerster, J, ve diğerleri
Baskı/Yayın Bilgisi: (2017)

Ahora nos ven
Yazar:: María Alma Tozzini, ve diğerleri
Baskı/Yayın Bilgisi: (2022-10-01)

Transient non−stationarity and generalisation in deep reinforcement learning
Yazar:: Igl, M, ve diğerleri
Baskı/Yayın Bilgisi: (2021)

Value factor of the countries uneven development
Yazar:: A. A. Belov, ve diğerleri
Baskı/Yayın Bilgisi: (2023-06-01)

Noise-Regularized Advantage Value for Multi-Agent Reinforcement Learning
Yazar:: Siying Wang, ve diğerleri
Baskı/Yayın Bilgisi: (2022-08-01)

Zabolevaniya ven i beremennost'
Yazar:: A V Murashko
Baskı/Yayın Bilgisi: (2005-12-01)

¿Qué ven cuando nos ven? Representaciones infantiles sobre la sociedad argentina actual
Yazar:: Isabelino A. Siede
Baskı/Yayın Bilgisi: (2024-05-01)

Infrastructure, sustainability and unevenness : exploring marginalization in Mexico
Yazar:: Quezada Medina, Jessica.
Baskı/Yayın Bilgisi: (2020)

End-to-end deep reinforcement learning for multi-agent collaborative exploration
Yazar:: Chen, Zichen, ve diğerleri
Baskı/Yayın Bilgisi: (2021)

Overview of Multi-agent Deep Reinforcement Learning Based on Value Factorization
Yazar:: XIONG Li-qin, CAO Lei, LAI Jun, CHEN Xi-liang
Baskı/Yayın Bilgisi: (2022-09-01)

Joan Larzac, L’an que ven d’onte ven : escriure e renaisse sensa relambi
Yazar:: Sylvan Chabaud
Baskı/Yayın Bilgisi: (2023-12-01)

Improving single and multi-agent deep reinforcement learning methods
Yazar:: Gupta, T
Baskı/Yayın Bilgisi: (2023)

Reinforcing unevenness: post-crisis geography and the spatial selectivity of the state
Yazar:: Mikael Omstedt
Baskı/Yayın Bilgisi: (2016-01-01)

Ven, entra y tómame, saboréame…
Yazar:: Patrizia Valduga
Baskı/Yayın Bilgisi: (2011-01-01)

Rusland – kulturel ven eller fjende?
Yazar:: Marie Krarup
Baskı/Yayın Bilgisi: (2019-08-01)

Varikoznaya bolezn' ven malogo taza
Yazar:: V Yu Bogachev
Baskı/Yayın Bilgisi: (2006-08-01)

Shifts in drugs use after the COVID-19 pandemic based on the analysis of ABC, VEN and ABC-VEN matrix
Yazar:: Yulistiani Yulistiani, ve diğerleri
Baskı/Yayın Bilgisi: (2023-11-01)

Towards coordinated multi-agent exploration problem via segmentation and reinforcement learning
Yazar:: Chen, Zichen
Baskı/Yayın Bilgisi: (2020)

Reinforcement Learning with Value Function Decomposition for Hierarchical Multi-Agent Consensus Control
Yazar:: Xiaoxia Zhu
Baskı/Yayın Bilgisi: (2024-09-01)

Deep-reinforcement-learning-based gait pattern controller on an uneven terrain for humanoid robots
Yazar:: Ping-Huan Kuo, ve diğerleri
Baskı/Yayın Bilgisi: (2023-12-01)

The challenges and future perspective of Kenaf Wo-ven reinforcement in thermoset polymer composites in Malaysia: a review
Yazar:: Lee, Ching Hao, ve diğerleri
Baskı/Yayın Bilgisi: (2021)

VIREL: A variational inference framework for reinforcement learning
Yazar:: Fellows, M, ve diğerleri
Baskı/Yayın Bilgisi: (2019)

Regularized Softmax Deep Multi−Agent Q−Learning
Yazar:: Pan, L, ve diğerleri
Baskı/Yayın Bilgisi: (2022)

Deep reinforcement learning to multi-agent deep reinforcement learning
Yazar:: Samieiyeganeh, Mehdi, ve diğerleri
Baskı/Yayın Bilgisi: (2022)

Deep multi-agent reinforcement learning
Yazar:: Foerster, J
Baskı/Yayın Bilgisi: (2018)