发明公开
- 专利标题: 一种具有适应性的DQN模型优化方法及应用
-
申请号: CN202211392142.8申请日: 2022-11-08
-
公开(公告)号: CN115903485A公开(公告)日: 2023-04-04
- 发明人: 谭墍元 , 袁倩 , 郭伟伟 , 刘福裕
- 申请人: 北方工业大学
- 申请人地址: 北京市石景山区晋元庄路5号
- 专利权人: 北方工业大学
- 当前专利权人: 北方工业大学
- 当前专利权人地址: 北京市石景山区晋元庄路5号
- 代理机构: 深圳市育科知识产权代理有限公司
- 代理商 洪秀凤
- 主分类号: G05B13/04
- IPC分类号: G05B13/04 ; G08G1/08 ; G08G1/01
摘要:
本发明提供一种具有适应性的DQN模型优化方法及应用,方法包括:设计交叉口,定义DQN模型的状态、动作和奖励函数,设置DQN模型的超参数;设定多个交通场景;基于多个交通场景对DQN模型分别进行训练,得到多个训练后的DQN模型;设定新交通场景;将多个交通场景中的至少一个交通场景以及新交通场景作为测试交通场景,基于测试交通场景对多个训练后的DQN模型分别进行适应性检验,筛选得到优化后的DQN模型。本发明通过设计的多个交通场景分别对DQN模型进行训练,通过设计的测试交通场景对训练后的多个DQN模型进行适应性检验,筛选出优化后的DQN模型,可适用于不同交叉口的各交通场景,实现对不同交叉口的交通信号控制。