深度强化学习算法与应用研究现状综述

深度强化学习主要被用来处理感知-决策问题，已经成为人工智能领域重要的研究分支。概述了基于值函数和策略梯度的两类深度强化学习算法，详细阐述了深度Q网络、深度策略梯度及相关改进算法的原理，并综述了深度强化学习在视频游戏、导航、多智能体协作以及推荐系统等领域的应用研究进展。最后，对深度强化学习的算法和应用进行展望，针对一些未来的研究方向和研究热点给出了建议。...

Full description

Bibliographic Details
Main Authors:	刘朝阳, 穆朝絮, 孙长银
Format:	Article
Language:	zho
Published:	POSTS&TELECOM PRESS Co., LTD 2020-12-01
Series:	智能科学与技术学报
Subjects:	人工智能深度强化学习值函数策略梯度导航协作复杂环境泛化性鲁棒性
Online Access:	http://www.infocomm-journal.com/znkx/CN/abstract/abstract170947.shtml

Internet

http://www.infocomm-journal.com/znkx/CN/abstract/abstract170947.shtml

深度强化学习算法与应用研究现状综述

Internet

Similar Items