基于改进DQN算法的复杂海战场路径规划方法

为了有效地解决海战场环境下多舰艇的追踪目标问题，以多智能体（舰艇）为研究对象，提出一种基于改进的Deep Q-Network（DQN）算法的路径规划方法。DQN算法结合多智能体的强化学习环境特性，在传统DQN算法的基础上，添加一个结构相同、参数不同的网络，分别对Q实际值和估计值进行更新来实现价值函数的收敛。此外，该方法使用经验回放和目标网络双参数更新机制，有效地解决了神经网络训练误差大、泛化能力差和训练不稳定等问题。实验结果表明，与传统的算法相比，提出的方法能够更快地适应复杂多变的多类型海战场环境，避障能力提高两倍多，并且在环境中能够获得更高的训练奖励。...

Full description

Bibliographic Details
Main Authors:	郁洲, 毕敬, 苑海涛
Format:	Article
Language:	zho
Published:	POSTS&TELECOM PRESS Co., LTD 2022-09-01
Series:	智能科学与技术学报
Subjects:	深度q网络强化学习多智能体路径规划目标追踪
Online Access:	http://www.infocomm-journal.com/znkx/CN/abstract/abstract172773.shtml

Internet

http://www.infocomm-journal.com/znkx/CN/abstract/abstract172773.shtml

基于改进DQN算法的复杂海战场路径规划方法

Internet

Similar Items