一种货车组协作控制方法、系统、设备及介质
摘要:
本发明涉及交通控制技术领域,特别涉及一种货车组协作控制方法、系统、设备及介质。方法包括如下步骤:获取货车组的实际运行情况;将所述货车组的实际运行情况输入训练好的Q网络中;通过所述Q网络得到所述货车组执行每个动作对应的价值,并输出价值最高对应的动作。强化学习弥补了APF易陷入局部最优的问题从而找到全局最优策略,而基于APF设计的奖励函数为强化学习提供丰富的先验知识,提高了训练效率,鲁棒性更强,安全性能更佳,更适宜于工业物联网的货车组运输实际。
0/0