基于DQN的列车节能驾驶控制方法
随着轨道交通网络规模的扩大和列车运营间隔的缩短,列车牵引能耗在快速增加。因此,通过优化列车的驾驶策略降低牵引能耗,对于轨道交通系统的节能减排具有重大意义。针对列车的驾驶策略优化问题,提出一种基于深度 Q 网络(DQN)的列车节能驾驶控制方法。首先介绍了传统的列车节能驾驶问题并构造其反问题,即通过分配最少的能耗达到规定运行时分。进一步将该问题转化为有限马尔可夫决策过程(MDP),通过设计状态动作值函数、定义动作策略选取方法等,构建基于 DQN 方法的列车节能驾驶控制方法。通过实际驾驶数据对DQN 进行训练,得到最优的状态动作值函数,并通过该值函数确定最优的能耗分配方案,从而得到最优驾驶策略。最后...
Main Authors: | , , , , |
---|---|
Format: | Article |
Language: | zho |
Published: |
POSTS&TELECOM PRESS Co., LTD
2020-12-01
|
Series: | 智能科学与技术学报 |
Subjects: | |
Online Access: | http://www.infocomm-journal.com/znkx/CN/abstract/abstract170953.shtml |
_version_ | 1828061904520609792 |
---|---|
author | 宿帅 朱擎阳 魏庆来 唐涛 阴佳腾 |
author_facet | 宿帅 朱擎阳 魏庆来 唐涛 阴佳腾 |
author_sort | 宿帅 |
collection | DOAJ |
description | 随着轨道交通网络规模的扩大和列车运营间隔的缩短,列车牵引能耗在快速增加。因此,通过优化列车的驾驶策略降低牵引能耗,对于轨道交通系统的节能减排具有重大意义。针对列车的驾驶策略优化问题,提出一种基于深度 Q 网络(DQN)的列车节能驾驶控制方法。首先介绍了传统的列车节能驾驶问题并构造其反问题,即通过分配最少的能耗达到规定运行时分。进一步将该问题转化为有限马尔可夫决策过程(MDP),通过设计状态动作值函数、定义动作策略选取方法等,构建基于 DQN 方法的列车节能驾驶控制方法。通过实际驾驶数据对DQN 进行训练,得到最优的状态动作值函数,并通过该值函数确定最优的能耗分配方案,从而得到最优驾驶策略。最后,以北京地铁亦庄线的实际运营数据设计了仿真算例,对方法的有效性进行验证,并对方法参数进行了敏感度分析。提出的方法可充分利用列车的驾驶数据提升驾驶策略,降低列车牵引能耗,对未来我国智慧城轨的发展具有一定的借鉴意义。 |
first_indexed | 2024-04-10T22:21:09Z |
format | Article |
id | doaj.art-9d97b1d4655e40cba0ef544f54843372 |
institution | Directory Open Access Journal |
issn | 2096-6652 |
language | zho |
last_indexed | 2024-04-10T22:21:09Z |
publishDate | 2020-12-01 |
publisher | POSTS&TELECOM PRESS Co., LTD |
record_format | Article |
series | 智能科学与技术学报 |
spelling | doaj.art-9d97b1d4655e40cba0ef544f548433722023-01-18T03:10:02ZzhoPOSTS&TELECOM PRESS Co., LTD智能科学与技术学报2096-66522020-12-0124372384基于DQN的列车节能驾驶控制方法宿帅0朱擎阳1魏庆来2唐涛3阴佳腾4北京交通大学轨道交通控制与安全国家重点实验室北京交通大学轨道交通控制与安全国家重点实验室中国科学院自动化研究所复杂系统管理与控制国家重点实验室北京交通大学轨道交通控制与安全国家重点实验室北京交通大学轨道交通控制与安全国家重点实验室随着轨道交通网络规模的扩大和列车运营间隔的缩短,列车牵引能耗在快速增加。因此,通过优化列车的驾驶策略降低牵引能耗,对于轨道交通系统的节能减排具有重大意义。针对列车的驾驶策略优化问题,提出一种基于深度 Q 网络(DQN)的列车节能驾驶控制方法。首先介绍了传统的列车节能驾驶问题并构造其反问题,即通过分配最少的能耗达到规定运行时分。进一步将该问题转化为有限马尔可夫决策过程(MDP),通过设计状态动作值函数、定义动作策略选取方法等,构建基于 DQN 方法的列车节能驾驶控制方法。通过实际驾驶数据对DQN 进行训练,得到最优的状态动作值函数,并通过该值函数确定最优的能耗分配方案,从而得到最优驾驶策略。最后,以北京地铁亦庄线的实际运营数据设计了仿真算例,对方法的有效性进行验证,并对方法参数进行了敏感度分析。提出的方法可充分利用列车的驾驶数据提升驾驶策略,降低列车牵引能耗,对未来我国智慧城轨的发展具有一定的借鉴意义。http://www.infocomm-journal.com/znkx/CN/abstract/abstract170953.shtml列车节能驾驶驾驶策略深度q网络 |
spellingShingle | 宿帅 朱擎阳 魏庆来 唐涛 阴佳腾 基于DQN的列车节能驾驶控制方法 智能科学与技术学报 列车节能驾驶 驾驶策略 深度q网络 |
title | 基于DQN的列车节能驾驶控制方法 |
title_full | 基于DQN的列车节能驾驶控制方法 |
title_fullStr | 基于DQN的列车节能驾驶控制方法 |
title_full_unstemmed | 基于DQN的列车节能驾驶控制方法 |
title_short | 基于DQN的列车节能驾驶控制方法 |
title_sort | 基于dqn的列车节能驾驶控制方法 |
topic | 列车节能驾驶 驾驶策略 深度q网络 |
url | http://www.infocomm-journal.com/znkx/CN/abstract/abstract170953.shtml |
work_keys_str_mv | AT sùshuài jīyúdqndelièchējiénéngjiàshǐkòngzhìfāngfǎ AT zhūqíngyáng jīyúdqndelièchējiénéngjiàshǐkòngzhìfāngfǎ AT wèiqìnglái jīyúdqndelièchējiénéngjiàshǐkòngzhìfāngfǎ AT tángtāo jīyúdqndelièchējiénéngjiàshǐkòngzhìfāngfǎ AT yīnjiāténg jīyúdqndelièchējiénéngjiàshǐkòngzhìfāngfǎ |