基于数据驱动的无人车控制方法、装置和计算机设备
摘要:
本申请涉及一种基于数据驱动的无人车控制方法、装置和计算机设备。所述方法包括:通过表示无人车状态约束的障碍函数构建无人车安全相关的代价函数和控制策略结构,构造值函数网络,得到多步策略评估的参考代价函数;构造控制策略逼近网络,根据获取的多组数据对序列,得到值函数更新律和控制策略权值更新律,对无人车进行控制。本发明提出了一种基于障碍函数的控制策略可实现最优性和安全性的平衡,算法不需要模型信息,只需要事先采集数据对信息,同时,采用多步策略评估的方法对策略的安全性进行评估,可处理时变约束,可以边在线训练边部署,也可以先离线训练再部署。
0/0