基于深度强化学习的六足机器人运动规划

六足机器人拥有多个冗余自由度,适用于复杂的非结构环境。离散环境作为非结构环境的一个苛刻特例,需要六足机器人具备更加高效可靠的运动策略。以平面随机梅花桩为例,设定随机起始点与目标区域,利用深度强化学习算法进行训练,并得到六足机器人在平面梅花桩环境中的运动策略。为了加快训练进程,采用具有优先经验重放机制的深度确定性策略梯度算法。最后在真实环境中进行验证,实验结果表明,所规划的运动策略能让六足机器人在平面梅花桩环境中高效平稳地从起始点运动到目标区域。为六足机器人在真实离散环境中的精确运动规划奠定了基础。...

Full description

Bibliographic Details
Main Authors: 傅汇乔, 唐开强, 邓归洲, 王鑫鹏, 陈春林
Format: Article
Language:zho
Published: POSTS&TELECOM PRESS Co., LTD 2020-12-01
Series:智能科学与技术学报
Subjects:
Online Access:http://www.infocomm-journal.com/znkx/CN/abstract/abstract170952.shtml