أرسل هذا في رسالة قصيرة: Trading performance for stability in Markov decision processes