Weighted QMIX: Expanding monotonic value function factorisation for deep multi−agent reinforcement learning

Weighted QMIX: Expanding monotonic value function factorisation for deep multi−agent reinforcement learning

QMIX is a popular Q-learning algorithm for cooperative MARL in the centralised training and decentralised execution paradigm. In order to enable easy decentralisation, QMIX restricts the joint action Q-values it can represent to be a monotonic mixing of each agent’s utilities. However, this restrict...

Bibliografiset tiedot
Päätekijät:	Rashid, T, Farquhar, G, Peng, B, Whiteson, S
Aineistotyyppi:	Conference item
Kieli:	English
Julkaistu:	NeurIPS 2020

Samankaltaisia teoksia

QMIX: Monotonic value function factorisation for deep multi-agent reinforcement learning
Tekijä: Rashid, T, et al.
Julkaistu: (2018)

Monotonic value function factorisation for deep multi-agent reinforcement learning
Tekijä: Rashid, T, et al.
Julkaistu: (2020)

Exploration and value function factorisation in single and multi-agent reinforcement learning
Tekijä: Rashid, T
Julkaistu: (2021)

Stabilising experience replay for deep multi-agent reinforcement learning
Tekijä: Foerster, J, et al.
Julkaistu: (2017)

Bayesian action decoder for deep multi-agent reinforcement learning
Tekijä: Whiteson, S
Julkaistu: (2019)

UneVEn: Universal value exploration for multi-agent reinforcement learning
Tekijä: Gupta, T, et al.
Julkaistu: (2021)

Learning to communicate with Deep multi-agent reinforcement learning
Tekijä: Foerster, J, et al.
Julkaistu: (2016)

Multi-agent common knowledge reinforcement learning
Tekijä: de Witt, C, et al.
Julkaistu: (2019)

Regularized Softmax Deep Multi−Agent Q−Learning
Tekijä: Pan, L, et al.
Julkaistu: (2022)

Analysing factorizations of action-value networks for cooperative multi-agent reinforcement learning
Tekijä: Castellini, J, et al.
Julkaistu: (2021)

Deep reinforcement learning to multi-agent deep reinforcement learning
Tekijä: Samieiyeganeh, Mehdi, et al.
Julkaistu: (2022)

Deep multi-agent reinforcement learning
Tekijä: Foerster, J
Julkaistu: (2018)

Counterfactual multi−agent policy gradients
Tekijä: Foerster, J, et al.
Julkaistu: (2018)

QMix: A Python package for simulating the quasiparticle tunneling currents in SIS junctions
Tekijä: Garrett, J, et al.
Julkaistu: (2019)

TreeQN and ATreeC: differentiable tree planning for deep reinforcement learning
Tekijä: Farquhar, G, et al.
Julkaistu: (2018)

Transient non−stationarity and generalisation in deep reinforcement learning
Tekijä: Igl, M, et al.
Julkaistu: (2021)

Randomized entity-wise factorization for multi-agent reinforcement learning
Tekijä: Iqbal, S, et al.
Julkaistu: (2021)

On Factorisation of Provenance Polynomials
Tekijä: Olteanu, D, et al.
Julkaistu: (2011)

Factorisation in relational databases
Tekijä: Zavodny, J
Julkaistu: (2014)

Coordination and communication in deep multi-agent reinforcement learning
Tekijä: Schroeder de Witt, CA
Julkaistu: (2021)

Loading monotonicity of weighted premiums, and total positivity properties of weight functions
Tekijä: Richards, Donald, et al.
Julkaistu: (2021)

From matrix factorisation to signal propagation in deep learning: algorithms and guarantees
Tekijä: Murray, M
Julkaistu: (2021)

Factorising Proofs in Timed CSP
Tekijä: Davies, J, et al.
Julkaistu: (1989)

Pushing forward matrix factorisations
Tekijä: Dyckerhoff, T, et al.
Julkaistu: (2011)

Improving single and multi-agent deep reinforcement learning methods
Tekijä: Gupta, T
Julkaistu: (2023)

MAVEN: Multi-Agent Variational Exploration
Tekijä: Mahajan, A, et al.
Julkaistu: (2019)

Efficient and scalable methods for deep reinforcement learning
Tekijä: Farquhar, G
Julkaistu: (2020)

Tesseract: tensorised actors for multi−agent reinforcement learning
Tekijä: Mahajan, A, et al.
Julkaistu: (2021)

The value of information in monotone decixion problems
Tekijä: Athey, Susan, et al.
Julkaistu: (2011)

Deep residual reinforcement learning
Tekijä: Zhang, S, et al.
Julkaistu: (2020)

End-to-end deep reinforcement learning for multi-agent collaborative exploration
Tekijä: Chen, Zichen, et al.
Julkaistu: (2021)

Multi-agent deep reinforcement learning for mix-mode runway sequencing
Tekijä: Shi, Limin, et al.
Julkaistu: (2022)

The StarCraft Multi-Agent Challenge
Tekijä: Mikayel Samvelyan, et al.
Julkaistu: (2019)

Deep decentralized multi-task multi-agent reinforcement learning under partial observability
Tekijä: How, Jonathan
Julkaistu: (2021)

Factorisation of greedoid polynomials of rooted digraphs
Tekijä: Yow, Kai Siong, et al.
Julkaistu: (2021)

The antitriangular factorisation of saddle point matrices
Tekijä: Pestana, J, et al.
Julkaistu: (2013)

Monotone Equilibrium in Multi-Unit Auctions
Tekijä: McAdams, David
Julkaistu: (2002)

Multi-agent deep reinforcement learning based multi-timescale voltage control for distribution system
Tekijä: Wang, Bingyu
Julkaistu: (2022)

Loaded DiCE: Trading off bias and variance in any-order score function gradient estimators for reinforcement learning
Tekijä: Farquhar, G, et al.
Julkaistu: (2019)

Forward jets in high energy factorisation at the lhc
Tekijä: Deák, M, et al.
Julkaistu: (2009)