- 专利标题: EADP控制器的离线训练方法和系统及其在线控制方法和系统
- 专利标题(英): EADP controller off-line training method, EADP controller off-line training system, EADP controller online training method and EADP controller online training system
-
申请号: CN201511009719.2申请日: 2015-12-29
-
公开(公告)号: CN105513380A公开(公告)日: 2016-04-20
- 发明人: 王飞跃 , 刘裕良 , 吕宜生 , 段艳杰 , 陈松航
- 申请人: 中国科学院自动化研究所
- 申请人地址: 北京市海淀区中关村东路95号
- 专利权人: 中国科学院自动化研究所
- 当前专利权人: 青岛慧拓智能机器有限公司
- 当前专利权人地址: 北京市海淀区中关村东路95号
- 代理机构: 北京博维知识产权代理事务所
- 代理商 郭文浩
- 主分类号: G08G1/08
- IPC分类号: G08G1/08 ; G08G1/01
摘要:
本发明公开了一种用于交叉路口交通信号控制的EADP控制器离线训练方法和系统以及EADP控制器在线控制方法和系统。其中,该方法包括:根据得到的系统状态和构建好的各子ADP控制器的Action网络和Critic网络,确定回报函数、系统控制参数和性能指标;并根据性能指标和回报函数交替地训练各子ADP控制器的Critic网络以及根据性能指标和系统控制参数交替地训练各子ADP控制器的Action网络,以更新Critic网络的权值和Action网络的权值;确定在训练达到训练目标时,记录各子ADP控制器的Action网络的权值和Critic网络的权值。通过本发明实施例解决了传统ADP控制器稳定性难以保证的技术问题,进而实现了对交通信号的自适应控制。
公开/授权文献
- CN105513380B EADP控制器的离线训练方法和系统及其在线控制方法和系统 公开/授权日:2018-07-31
IPC分类: