Fourier policy gradients
We propose a new way of deriving policy gradient updates for reinforcement learning. Our technique, based on Fourier analysis, recasts integrals that arise with expected policy gradients as convolutions and turns them into multiplications. The obtained analytical solutions allow us to capture the lo...
Հիմնական հեղինակներ: | Fellows, M, Ciosek, K, Whiteson, S |
---|---|
Ձևաչափ: | Conference item |
Հրապարակվել է: |
Journal of Machine Learning Research
2018
|
Նմանատիպ նյութեր
-
Expected policy gradients
: Ciosek, K, և այլն
Հրապարակվել է: (2018) -
Expected policy gradients for reinforcement learning
: Ciosek, K, և այլն
Հրապարակվել է: (2020) -
OFFER: Off-environment reinforcement learning
: Ciosek, K, և այլն
Հրապարակվել է: (2017) -
Counterfactual multi−agent policy gradients
: Foerster, J, և այլն
Հրապարակվել է: (2018) -
Fast efficient hyperparameter tuning for policy gradient methods
: Paul, S, և այլն
Հրապարակվել է: (2019)