一种单交叉口信号控制模型迁移至目标环境的方法

发明授权

CN117114079B 一种单交叉口信号控制模型迁移至目标环境的方法有权

请登陆查看更多内容

专利标题： 一种单交叉口信号控制模型迁移至目标环境的方法
申请号： CN202311387091.4

申请日： 2023-10-25
公开(公告)号： CN117114079B

公开(公告)日： 2024-01-26
发明人: 陈敬龙 , 张鑫湋 , 葛天 , 徐文轩 , 李振 , 唐涛 , 谭墍元 , 薛晴婉
申请人： 中泰信合智能科技有限公司 , 山东摩西网络科技有限公司 , 北方工业大学 , 中国广电山东网络有限公司青岛市分公司
申请人地址： 山东省青岛市高新区汇智桥路151号腾讯众创空间4层4299室
专利权人： 中泰信合智能科技有限公司,山东摩西网络科技有限公司,北方工业大学,中国广电山东网络有限公司青岛市分公司
当前专利权人： 中泰信合智能科技有限公司,山东摩西网络科技有限公司,北方工业大学,中国广电山东网络有限公司青岛市分公司
当前专利权人地址： 山东省青岛市高新区汇智桥路151号腾讯众创空间4层4299室
代理机构： 山东明宇知信知识产权代理事务所
代理商 张涛
主分类号： G06N3/092
IPC分类号： G06N3/092 ; G06N3/042 ; G06F30/27 ; G08G1/07

摘要：

本发明属于智能控制领域，具体涉及一种单交叉口信号控制模型迁移至目标环境的方法，本专利将控制模型从源训练环境迁移到目标环境，首先搭建信号控制模型的DQN深度强化学习框架；其次对控制模型的迁移环境进行交叉口参数匹配以及DQN参数校准，判断是否满足目标环境；然后基于控制模型在源训练环境下得到的先验知识，对目标环境中原始控制模型的神经网络权重进行初始化设置，得到迁移至目标环境的控制模型；最后在目标环境下对控制模型优化训练，待模型收敛后，停止优化训练。实验表明可以节省在控制模型迁移至新环境中，可以减少训练控制模型的时间成本，同时优化训练后的控制模型(56)对比文件Zhengyi Ge《.Reinforcement Learning-based Signal Control Strategies toImprove Travel Efficiency at UrbanIntersection》《.2020 InternationalConference on Urban Engineering andManagement Science (ICUEMS)》.2020,全文.温凯歌;曲仕茹;张玉梅.城市单交叉口信号多相位自适应控制模型.系统仿真学报.2009,(第10期),全文.

公开/授权文献

CN117114079A 一种单交叉口信号控制模型迁移至目标环境的方法公开/授权日：2023-11-24

信息查询

中国专利公布公告 Global Dossier Espacenet