-
公开(公告)号:CN114971152A
公开(公告)日:2022-08-30
申请号:CN202210333052.5
申请日:2022-03-31
Inventor: 王铁铮 , 喻晓 , 徐于海 , 左芳芳 , 朱军 , 石亮 , 李珍 , 姚伟谨 , 康乃馨 , 孙鹏 , 张弛 , 黄磊 , 施菁菁 , 张莉 , 安明 , 杨帆 , 闫德健 , 习毅聪 , 孙坳 , 张苗苗 , 江婷 , 田梦 , 车鑫 , 张洁 , 鲁敬 , 柏慧 , 赵阳 , 贾梦娇 , 姜明璇
Abstract: 本发明涉及交通控制技术领域,特别涉及一种货车组协作控制方法、系统、设备及介质。方法包括如下步骤:获取货车组的实际运行情况;将所述货车组的实际运行情况输入训练好的Q网络中;通过所述Q网络得到所述货车组执行每个动作对应的价值,并输出价值最高对应的动作。强化学习弥补了APF易陷入局部最优的问题从而找到全局最优策略,而基于APF设计的奖励函数为强化学习提供丰富的先验知识,提高了训练效率,鲁棒性更强,安全性能更佳,更适宜于工业物联网的货车组运输实际。