Үүнийг мессежээр илгээх: Robust reinforcement learning with Bayesian optimisation and quadrature