Fourier policy gradients

We propose a new way of deriving policy gradient updates for reinforcement learning. Our technique, based on Fourier analysis, recasts integrals that arise with expected policy gradients as convolutions and turns them into multiplications. The obtained analytical solutions allow us to capture the lo...

Ամբողջական նկարագրություն

Մատենագիտական մանրամասներ
Հիմնական հեղինակներ: Fellows, M, Ciosek, K, Whiteson, S
Ձևաչափ: Conference item
Հրապարակվել է: Journal of Machine Learning Research 2018

Նմանատիպ նյութեր