- 专利标题: 一种单交叉口信号控制模型迁移至目标环境的方法
-
申请号: CN202311387091.4申请日: 2023-10-25
-
公开(公告)号: CN117114079B公开(公告)日: 2024-01-26
- 发明人: 陈敬龙 , 张鑫湋 , 葛天 , 徐文轩 , 李振 , 唐涛 , 谭墍元 , 薛晴婉
- 申请人: 中泰信合智能科技有限公司 , 山东摩西网络科技有限公司 , 北方工业大学 , 中国广电山东网络有限公司青岛市分公司
- 申请人地址: 山东省青岛市高新区汇智桥路151号腾讯众创空间4层4299室
- 专利权人: 中泰信合智能科技有限公司,山东摩西网络科技有限公司,北方工业大学,中国广电山东网络有限公司青岛市分公司
- 当前专利权人: 中泰信合智能科技有限公司,山东摩西网络科技有限公司,北方工业大学,中国广电山东网络有限公司青岛市分公司
- 当前专利权人地址: 山东省青岛市高新区汇智桥路151号腾讯众创空间4层4299室
- 代理机构: 山东明宇知信知识产权代理事务所
- 代理商 张涛
- 主分类号: G06N3/092
- IPC分类号: G06N3/092 ; G06N3/042 ; G06F30/27 ; G08G1/07
摘要:
本发明属于智能控制领域,具体涉及一种单交叉口信号控制模型迁移至目标环境的方法,本专利将控制模型从源训练环境迁移到目标环境,首先搭建信号控制模型的DQN深度强化学习框架;其次对控制模型的迁移环境进行交叉口参数匹配以及DQN参数校准,判断是否满足目标环境;然后基于控制模型在源训练环境下得到的先验知识,对目标环境中原始控制模型的神经网络权重进行初始化设置,得到迁移至目标环境的控制模型;最后在目标环境下对控制模型优化训练,待模型收敛后,停止优化训练。实验表明可以节省在控制模型迁移至新环境中,可以减少训练控制模型的时间成本,同时优化训练后的控制模型(56)对比文件Zhengyi Ge《.Reinforcement Learning-based Signal Control Strategies toImprove Travel Efficiency at UrbanIntersection》《.2020 InternationalConference on Urban Engineering andManagement Science (ICUEMS)》.2020,全文.温凯歌;曲仕茹;张玉梅.城市单交叉口信号多相位自适应控制模型.系统仿真学报.2009,(第10期),全文.
公开/授权文献
- CN117114079A 一种单交叉口信号控制模型迁移至目标环境的方法 公开/授权日:2023-11-24