一种具有适应性的DQN模型优化方法及应用

发明公开

CN115903485A 一种具有适应性的DQN模型优化方法及应用审中-实审

请登陆查看更多内容

专利标题： 一种具有适应性的DQN模型优化方法及应用
申请号： CN202211392142.8

申请日： 2022-11-08
公开(公告)号： CN115903485A

公开(公告)日： 2023-04-04
发明人: 谭墍元 , 袁倩 , 郭伟伟 , 刘福裕
申请人： 北方工业大学
申请人地址： 北京市石景山区晋元庄路5号
专利权人： 北方工业大学
当前专利权人： 北方工业大学
当前专利权人地址： 北京市石景山区晋元庄路5号
代理机构： 深圳市育科知识产权代理有限公司
代理商 洪秀凤
主分类号： G05B13/04
IPC分类号： G05B13/04 ; G08G1/08 ; G08G1/01

摘要：

本发明提供一种具有适应性的DQN模型优化方法及应用，方法包括：设计交叉口，定义DQN模型的状态、动作和奖励函数，设置DQN模型的超参数；设定多个交通场景；基于多个交通场景对DQN模型分别进行训练，得到多个训练后的DQN模型；设定新交通场景；将多个交通场景中的至少一个交通场景以及新交通场景作为测试交通场景，基于测试交通场景对多个训练后的DQN模型分别进行适应性检验，筛选得到优化后的DQN模型。本发明通过设计的多个交通场景分别对DQN模型进行训练，通过设计的测试交通场景对训练后的多个DQN模型进行适应性检验，筛选出优化后的DQN模型，可适用于不同交叉口的各交通场景，实现对不同交叉口的交通信号控制。

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G05	控制；调节
G05B	一般的控制或调节系统；这种系统的功能单元；用于这种系统或单元的监视或测试装置（应用流体作用的一般流体压力执行器或系统入F15B；阀门本身入F16K；仅按机械特征区分的入G05G；传感元件见相应小类，例如G12B，G01、H01的小类；校正单元见相应的小类，例如H02K）
G05B13/00	自适应控制系统，即系统按照一些预定的准则自动调整自己使之具有最佳性能的系统（G05B19/00优先；机器学习G06N 20/00）
G05B13/02	.电的
G05B13/04	..包括使用模型或模拟器的