多路口交通信号灯控制方法、装置、电子设备及存储介质
摘要:
本发明提供一种多路口交通信号灯控制方法、装置、电子设备及存储介质,采用的本地共享模型在训练时并不需要其他路口的训练样本,而是以联邦强化学习算法,借助于初始本地私有模型以及中央处理器智能体中与初始本地共享模型结构相同的初始全局模型进行集中‑分布式协同训练得到,可以保证各路口的时序交通状态信息观测样本的隐私性,即使不共享的情况下也可以得到准确的本地共享模型,避免了数据孤岛问题的出现。而且,由于采用基于联邦强化学习算法的集中‑分布式协同训练的方式,可以避免出现现有技术中对强化学习智能体训练时探索空间会呈现指数级增长的问题出现,可以实现最优化全局道路网络的交通状况。
0/0