一种具有适应性的DQN模型优化方法及应用

    公开(公告)号:CN115903485A

    公开(公告)日:2023-04-04

    申请号:CN202211392142.8

    申请日:2022-11-08

    IPC分类号: G05B13/04 G08G1/08 G08G1/01

    摘要: 本发明提供一种具有适应性的DQN模型优化方法及应用,方法包括:设计交叉口,定义DQN模型的状态、动作和奖励函数,设置DQN模型的超参数;设定多个交通场景;基于多个交通场景对DQN模型分别进行训练,得到多个训练后的DQN模型;设定新交通场景;将多个交通场景中的至少一个交通场景以及新交通场景作为测试交通场景,基于测试交通场景对多个训练后的DQN模型分别进行适应性检验,筛选得到优化后的DQN模型。本发明通过设计的多个交通场景分别对DQN模型进行训练,通过设计的测试交通场景对训练后的多个DQN模型进行适应性检验,筛选出优化后的DQN模型,可适用于不同交叉口的各交通场景,实现对不同交叉口的交通信号控制。