- 专利标题: 一种基于多视角编码迁移强化学习的区域信号灯协同控制方法
-
申请号: CN202110600132.8申请日: 2021-05-31
-
公开(公告)号: CN113299084A公开(公告)日: 2021-08-24
- 发明人: 葛宏伟 , 高东万 , 孙亮 , 候亚庆
- 申请人: 大连理工大学
- 申请人地址: 辽宁省大连市甘井子区凌工路2号
- 专利权人: 大连理工大学
- 当前专利权人: 大连理工大学
- 当前专利权人地址: 辽宁省大连市甘井子区凌工路2号
- 代理机构: 大连理工大学专利中心
- 代理商 温福雪
- 主分类号: G08G1/07
- IPC分类号: G08G1/07 ; G08G1/081 ; G08G1/01 ; G06N3/04 ; G06N3/06 ; G06N3/08
摘要:
本发明公开了一种基于多视角编码迁移强化学习的区域信号灯协同控制方法,属于机器学习与智能交通的交叉领域。方法包括一种多视角状态编码器以及一种迁移强化学习框架。提出的多视角状态编码器将路口的一维,二维状态以及邻域路口传来的状态信息进行整合编码,将结果作为路口智能体的实际输入。在提出的迁移强化学习框架中,首先独立地训练若干个专注于拟合能力的专家智能体;然后利用迁移来的专家智能体联合指导训练一个专注于泛化能力的种子智能体;最后将种子智能体的参数迁移到各个路口上进行自适应训练,并计算这些智能体与专家智能体的效果差异决定是否进行迭代训练。最终的智能体同时具有更好的决策能力和泛化性能,有效地缓解了交通拥堵。
公开/授权文献
- CN113299084B 一种基于多视角编码迁移强化学习的区域信号灯协同控制方法 公开/授权日:2022-04-12