Stochastic linear quadratic optimal tracking control for discrete-time systems with delays based on Q-learning algorithm

In this paper, a reinforcement Q-learning method based on value iteration (Ⅵ) is proposed for a class of model-free stochastic linear quadratic (SLQ) optimal tracking problem with time delay. Compared with the traditional reinforcement learning method, Q-learning method avoids the need for accurate...

Full description

Bibliographic Details
Main Authors:	Xufeng Tan, Yuan Li, Yang Liu
Format:	Article
Language:	English
Published:	AIMS Press 2023-02-01
Series:	AIMS Mathematics
Subjects:	reinforcement q-learning value iterative model-free stochastic linear quadratic optimal tracking time delay deterministic system
Online Access:	https://www.aimspress.com/article/doi/10.3934/math.2023519?viewType=HTML

Internet

https://www.aimspress.com/article/doi/10.3934/math.2023519?viewType=HTML

Stochastic linear quadratic optimal tracking control for discrete-time systems with delays based on Q-learning algorithm

Internet

Similar Items