一种基于多目标增强学习及贝塞尔曲线的汽车避障方法

    公开(公告)号:CN110254422A

    公开(公告)日:2019-09-20

    申请号:CN201910531612.6

    申请日:2019-06-19

    IPC分类号: B60W30/09

    摘要: 本发明提供了一种基于多目标增强学习及贝塞尔曲线的汽车避障方法,通过增强学习中的Q学习算法实现避障功能;进行MDP建模,进行MDP状态设计、MDP动作设计、以及MDP回报设计;确定Q学习的终止条件;将本车当前位置信息,前车位置信息以及前车车速作为输入,通过Q学习得到本车目标位置信息;得到车辆目标位置的离散点,在每两个离散点间通过三阶贝塞尔曲线拟合出一条曲线;将最终得到的曲线离散化,得到本车最终的一系列目标点。本发明解决了经典方法在自适应方面的不足,计算过程非常繁琐,对一些不确定性无法做出对的响应;自适应性强;解决了目前增强学习没有解决的时效性的问题,提高了最优轨迹的获取效率。