基于深度强化学习的六足机器人运动规划

六足机器人拥有多个冗余自由度,适用于复杂的非结构环境。离散环境作为非结构环境的一个苛刻特例,需要六足机器人具备更加高效可靠的运动策略。以平面随机梅花桩为例,设定随机起始点与目标区域,利用深度强化学习算法进行训练,并得到六足机器人在平面梅花桩环境中的运动策略。为了加快训练进程,采用具有优先经验重放机制的深度确定性策略梯度算法。最后在真实环境中进行验证,实验结果表明,所规划的运动策略能让六足机器人在平面梅花桩环境中高效平稳地从起始点运动到目标区域。为六足机器人在真实离散环境中的精确运动规划奠定了基础。...

Full description

Bibliographic Details
Main Authors: 傅汇乔, 唐开强, 邓归洲, 王鑫鹏, 陈春林
Format: Article
Language:zho
Published: POSTS&TELECOM PRESS Co., LTD 2020-12-01
Series:智能科学与技术学报
Subjects:
Online Access:http://www.infocomm-journal.com/znkx/CN/abstract/abstract170952.shtml
_version_ 1797950805384364032
author 傅汇乔
唐开强
邓归洲
王鑫鹏
陈春林
author_facet 傅汇乔
唐开强
邓归洲
王鑫鹏
陈春林
author_sort 傅汇乔
collection DOAJ
description 六足机器人拥有多个冗余自由度,适用于复杂的非结构环境。离散环境作为非结构环境的一个苛刻特例,需要六足机器人具备更加高效可靠的运动策略。以平面随机梅花桩为例,设定随机起始点与目标区域,利用深度强化学习算法进行训练,并得到六足机器人在平面梅花桩环境中的运动策略。为了加快训练进程,采用具有优先经验重放机制的深度确定性策略梯度算法。最后在真实环境中进行验证,实验结果表明,所规划的运动策略能让六足机器人在平面梅花桩环境中高效平稳地从起始点运动到目标区域。为六足机器人在真实离散环境中的精确运动规划奠定了基础。
first_indexed 2024-04-10T22:21:02Z
format Article
id doaj.art-836f3186e38842338f11f3e134ea50c4
institution Directory Open Access Journal
issn 2096-6652
language zho
last_indexed 2024-04-10T22:21:02Z
publishDate 2020-12-01
publisher POSTS&TELECOM PRESS Co., LTD
record_format Article
series 智能科学与技术学报
spelling doaj.art-836f3186e38842338f11f3e134ea50c42023-01-18T03:08:39ZzhoPOSTS&TELECOM PRESS Co., LTD智能科学与技术学报2096-66522020-12-0124361371基于深度强化学习的六足机器人运动规划傅汇乔0唐开强1邓归洲2王鑫鹏3陈春林4南京大学工程管理学院南京大学工程管理学院西南科技大学制造科学与工程学院西南科技大学制造科学与工程学院南京大学工程管理学院六足机器人拥有多个冗余自由度,适用于复杂的非结构环境。离散环境作为非结构环境的一个苛刻特例,需要六足机器人具备更加高效可靠的运动策略。以平面随机梅花桩为例,设定随机起始点与目标区域,利用深度强化学习算法进行训练,并得到六足机器人在平面梅花桩环境中的运动策略。为了加快训练进程,采用具有优先经验重放机制的深度确定性策略梯度算法。最后在真实环境中进行验证,实验结果表明,所规划的运动策略能让六足机器人在平面梅花桩环境中高效平稳地从起始点运动到目标区域。为六足机器人在真实离散环境中的精确运动规划奠定了基础。http://www.infocomm-journal.com/znkx/CN/abstract/abstract170952.shtml六足机器人运动规划深度强化学习
spellingShingle 傅汇乔
唐开强
邓归洲
王鑫鹏
陈春林
基于深度强化学习的六足机器人运动规划
智能科学与技术学报
六足机器人
运动规划
深度强化学习
title 基于深度强化学习的六足机器人运动规划
title_full 基于深度强化学习的六足机器人运动规划
title_fullStr 基于深度强化学习的六足机器人运动规划
title_full_unstemmed 基于深度强化学习的六足机器人运动规划
title_short 基于深度强化学习的六足机器人运动规划
title_sort 基于深度强化学习的六足机器人运动规划
topic 六足机器人
运动规划
深度强化学习
url http://www.infocomm-journal.com/znkx/CN/abstract/abstract170952.shtml
work_keys_str_mv AT fùhuìqiáo jīyúshēndùqiánghuàxuéxídeliùzújīqìrényùndòngguīhuà
AT tángkāiqiáng jīyúshēndùqiánghuàxuéxídeliùzújīqìrényùndòngguīhuà
AT dèngguīzhōu jīyúshēndùqiánghuàxuéxídeliùzújīqìrényùndòngguīhuà
AT wángxīnpéng jīyúshēndùqiánghuàxuéxídeliùzújīqìrényùndòngguīhuà
AT chénchūnlín jīyúshēndùqiánghuàxuéxídeliùzújīqìrényùndòngguīhuà