基于深度强化学习的六足机器人运动规划
六足机器人拥有多个冗余自由度,适用于复杂的非结构环境。离散环境作为非结构环境的一个苛刻特例,需要六足机器人具备更加高效可靠的运动策略。以平面随机梅花桩为例,设定随机起始点与目标区域,利用深度强化学习算法进行训练,并得到六足机器人在平面梅花桩环境中的运动策略。为了加快训练进程,采用具有优先经验重放机制的深度确定性策略梯度算法。最后在真实环境中进行验证,实验结果表明,所规划的运动策略能让六足机器人在平面梅花桩环境中高效平稳地从起始点运动到目标区域。为六足机器人在真实离散环境中的精确运动规划奠定了基础。...
Main Authors: | , , , , |
---|---|
Format: | Article |
Language: | zho |
Published: |
POSTS&TELECOM PRESS Co., LTD
2020-12-01
|
Series: | 智能科学与技术学报 |
Subjects: | |
Online Access: | http://www.infocomm-journal.com/znkx/CN/abstract/abstract170952.shtml |
_version_ | 1797950805384364032 |
---|---|
author | 傅汇乔 唐开强 邓归洲 王鑫鹏 陈春林 |
author_facet | 傅汇乔 唐开强 邓归洲 王鑫鹏 陈春林 |
author_sort | 傅汇乔 |
collection | DOAJ |
description | 六足机器人拥有多个冗余自由度,适用于复杂的非结构环境。离散环境作为非结构环境的一个苛刻特例,需要六足机器人具备更加高效可靠的运动策略。以平面随机梅花桩为例,设定随机起始点与目标区域,利用深度强化学习算法进行训练,并得到六足机器人在平面梅花桩环境中的运动策略。为了加快训练进程,采用具有优先经验重放机制的深度确定性策略梯度算法。最后在真实环境中进行验证,实验结果表明,所规划的运动策略能让六足机器人在平面梅花桩环境中高效平稳地从起始点运动到目标区域。为六足机器人在真实离散环境中的精确运动规划奠定了基础。 |
first_indexed | 2024-04-10T22:21:02Z |
format | Article |
id | doaj.art-836f3186e38842338f11f3e134ea50c4 |
institution | Directory Open Access Journal |
issn | 2096-6652 |
language | zho |
last_indexed | 2024-04-10T22:21:02Z |
publishDate | 2020-12-01 |
publisher | POSTS&TELECOM PRESS Co., LTD |
record_format | Article |
series | 智能科学与技术学报 |
spelling | doaj.art-836f3186e38842338f11f3e134ea50c42023-01-18T03:08:39ZzhoPOSTS&TELECOM PRESS Co., LTD智能科学与技术学报2096-66522020-12-0124361371基于深度强化学习的六足机器人运动规划傅汇乔0唐开强1邓归洲2王鑫鹏3陈春林4南京大学工程管理学院南京大学工程管理学院西南科技大学制造科学与工程学院西南科技大学制造科学与工程学院南京大学工程管理学院六足机器人拥有多个冗余自由度,适用于复杂的非结构环境。离散环境作为非结构环境的一个苛刻特例,需要六足机器人具备更加高效可靠的运动策略。以平面随机梅花桩为例,设定随机起始点与目标区域,利用深度强化学习算法进行训练,并得到六足机器人在平面梅花桩环境中的运动策略。为了加快训练进程,采用具有优先经验重放机制的深度确定性策略梯度算法。最后在真实环境中进行验证,实验结果表明,所规划的运动策略能让六足机器人在平面梅花桩环境中高效平稳地从起始点运动到目标区域。为六足机器人在真实离散环境中的精确运动规划奠定了基础。http://www.infocomm-journal.com/znkx/CN/abstract/abstract170952.shtml六足机器人运动规划深度强化学习 |
spellingShingle | 傅汇乔 唐开强 邓归洲 王鑫鹏 陈春林 基于深度强化学习的六足机器人运动规划 智能科学与技术学报 六足机器人 运动规划 深度强化学习 |
title | 基于深度强化学习的六足机器人运动规划 |
title_full | 基于深度强化学习的六足机器人运动规划 |
title_fullStr | 基于深度强化学习的六足机器人运动规划 |
title_full_unstemmed | 基于深度强化学习的六足机器人运动规划 |
title_short | 基于深度强化学习的六足机器人运动规划 |
title_sort | 基于深度强化学习的六足机器人运动规划 |
topic | 六足机器人 运动规划 深度强化学习 |
url | http://www.infocomm-journal.com/znkx/CN/abstract/abstract170952.shtml |
work_keys_str_mv | AT fùhuìqiáo jīyúshēndùqiánghuàxuéxídeliùzújīqìrényùndòngguīhuà AT tángkāiqiáng jīyúshēndùqiánghuàxuéxídeliùzújīqìrényùndòngguīhuà AT dèngguīzhōu jīyúshēndùqiánghuàxuéxídeliùzújīqìrényùndòngguīhuà AT wángxīnpéng jīyúshēndùqiánghuàxuéxídeliùzújīqìrényùndòngguīhuà AT chénchūnlín jīyúshēndùqiánghuàxuéxídeliùzújīqìrényùndòngguīhuà |