一种单交叉口信号控制模型迁移至目标环境的方法
摘要:
本发明属于智能控制领域,具体涉及一种单交叉口信号控制模型迁移至目标环境的方法,本专利将控制模型从源训练环境迁移到目标环境,首先搭建信号控制模型的DQN深度强化学习框架;其次对控制模型的迁移环境进行交叉口参数匹配以及DQN参数校准,判断是否满足目标环境;然后基于控制模型在源训练环境下得到的先验知识,对目标环境中原始控制模型的神经网络权重进行初始化设置,得到迁移至目标环境的控制模型;最后在目标环境下对控制模型优化训练,待模型收敛后,停止优化训练。实验表明可以节省在控制模型迁移至新环境中,可以减少训练控制模型的时间成本,同时优化训练后的控制模型(56)对比文件Zhengyi Ge《.Reinforcement Learning-based Signal Control Strategies toImprove Travel Efficiency at UrbanIntersection》《.2020 InternationalConference on Urban Engineering andManagement Science (ICUEMS)》.2020,全文.温凯歌;曲仕茹;张玉梅.城市单交叉口信号多相位自适应控制模型.系统仿真学报.2009,(第10期),全文.
0/0