依托强化学习的多风格车辆轨迹跟踪避撞控制方法及装置

    公开(公告)号:CN117302204B

    公开(公告)日:2024-02-20

    申请号:CN202311625357.4

    申请日:2023-11-30

    Abstract: 本发明公开了一种依托强化学习的多风格车辆轨迹跟踪避撞控制方法及装置,涉及自动驾驶车辆控制及智能算法技术领域。包括:获取待控制车辆的信息;将信息输入到构建好的基于强化学习框架的车辆轨迹跟踪避撞最优控制模型,输出多风格参数化策略网络;将信息中的自车状态、车辆观测信息以及风格指标系数输入到多风格参数化策略网络,输出动作量;根据动作量,实现多风格车辆轨迹跟踪避撞控制。本发明能够实现车辆轨迹跟踪避撞控制高精度、高实时性、高安全性且控制风格多样性的在线计算。

    自动驾驶车辆的权重系数和控制策略自学习方法及装置

    公开(公告)号:CN115626184A

    公开(公告)日:2023-01-20

    申请号:CN202211629437.2

    申请日:2022-12-19

    Abstract: 本发明公开了一种自动驾驶车辆的权重系数和控制策略自学习方法及装置,涉及车辆自动驾驶控制技术领域。包括:获取待优化的控制策略;将待优化的控制策略输入到构建好的控制策略双层优化模型;其中,控制策略双层优化模型包括权重系数优化层以及控制策略优化层;根据待优化的控制策略、权重系数优化层以及控制策略优化层,得到优化后的控制策略,基于优化后的控制策略对自动驾驶车辆进行控制。本发明基于给定的专家驾驶策略,通过模仿该目标控制策略实现控制代价函数权重系数和控制策略的自学习。本发明能够解决在控制自动驾驶车辆时,为了实现良好的控制性能而面临的不断调整代价函数的权重系数,且该方法能够实现控制策略的自提升。

    依托强化学习的多风格车辆轨迹跟踪避撞控制方法及装置

    公开(公告)号:CN117302204A

    公开(公告)日:2023-12-29

    申请号:CN202311625357.4

    申请日:2023-11-30

    Abstract: 本发明公开了一种依托强化学习的多风格车辆轨迹跟踪避撞控制方法及装置,涉及自动驾驶车辆控制及智能算法技术领域。包括:获取待控制车辆的信息;将信息输入到构建好的基于强化学习框架的车辆轨迹跟踪避撞最优控制模型,输出多风格参数化策略网络;将信息中的自车状态、车辆观测信息以及风格指标系数输入到多风格参数化策略网络,输出动作量;根据动作量,实现多风格车辆轨迹跟踪避撞控制。本发明能够实现车辆轨迹跟踪避撞控制高精度、高实时性、高安全性且控制风格多样性的在线计算。

    自动驾驶车辆的权重系数和控制策略自学习方法及装置

    公开(公告)号:CN115626184B

    公开(公告)日:2023-07-21

    申请号:CN202211629437.2

    申请日:2022-12-19

    Abstract: 本发明公开了一种自动驾驶车辆的权重系数和控制策略自学习方法及装置,涉及车辆自动驾驶控制技术领域。包括:获取待优化的控制策略;将待优化的控制策略输入到构建好的控制策略双层优化模型;其中,控制策略双层优化模型包括权重系数优化层以及控制策略优化层;根据待优化的控制策略、权重系数优化层以及控制策略优化层,得到优化后的控制策略,基于优化后的控制策略对自动驾驶车辆进行控制。本发明基于给定的专家驾驶策略,通过模仿该目标控制策略实现控制代价函数权重系数和控制策略的自学习。本发明能够解决在控制自动驾驶车辆时,为了实现良好的控制性能而面临的不断调整代价函数的权重系数,且该方法能够实现控制策略的自提升。

Patent Agency Ranking