一种基于多视角编码迁移强化学习的区域信号灯协同控制方法
摘要:
本发明公开了一种基于多视角编码迁移强化学习的区域信号灯协同控制方法,属于机器学习与智能交通的交叉领域。方法包括一种多视角状态编码器以及一种迁移强化学习框架。提出的多视角状态编码器将路口的一维,二维状态以及邻域路口传来的状态信息进行整合编码,将结果作为路口智能体的实际输入。在提出的迁移强化学习框架中,首先独立地训练若干个专注于拟合能力的专家智能体;然后利用迁移来的专家智能体联合指导训练一个专注于泛化能力的种子智能体;最后将种子智能体的参数迁移到各个路口上进行自适应训练,并计算这些智能体与专家智能体的效果差异决定是否进行迭代训练。最终的智能体同时具有更好的决策能力和泛化性能,有效地缓解了交通拥堵。
0/0