- 专利标题: 一种构建自动驾驶决策系统的方法、系统和介质
-
申请号: CN202010715409.7申请日: 2020-07-23
-
公开(公告)号: CN111985614B公开(公告)日: 2023-03-24
- 发明人: 牛京玉 , 胡瑜 , 韩银和 , 李晓维
- 申请人: 中国科学院计算技术研究所
- 申请人地址: 北京市海淀区中关村科学院南路6号
- 专利权人: 中国科学院计算技术研究所
- 当前专利权人: 中国科学院计算技术研究所
- 当前专利权人地址: 北京市海淀区中关村科学院南路6号
- 代理机构: 北京泛华伟业知识产权代理有限公司
- 代理商 王勇
- 主分类号: G06N3/092
- IPC分类号: G06N3/092 ; G06N3/0464 ; B60W60/00
摘要:
本发明实施例提供了一种构建自动驾驶决策系统的方法、系统和介质,所述自动驾驶决策系统包括强化学习模块和安全保障模块,所述安全保障模块包括基于规则的子模块和基于数据驱动的子模块,所述方法包括:A1、随机初始化强化学习模块和基于数据驱动的子模块的神经网络参数;A2、对自动驾驶决策系统依次进行第一学习阶段和第二学习阶段的训练;本发明无需大量的专家经验指导自动驾驶决策系统如何进行决策,节约了大量的训练成本,而且本发明的系统输出解析解作为经纠正的安全的动作向量,为驾驶的安全性提供了理论支撑,可以提高在实际应用中根据自动驾驶决策系统决策生成的动作向量进行自动驾驶的安全性。
公开/授权文献
- CN111985614A 一种构建自动驾驶决策系统的方法、系统和介质 公开/授权日:2020-11-24