一种基于不完全信息博弈的智能车换道决策方法

    公开(公告)号:CN112907967A

    公开(公告)日:2021-06-04

    申请号:CN202110134918.5

    申请日:2021-01-29

    申请人: 吉林大学

    IPC分类号: G08G1/01 G08G1/16

    摘要: 本发明公开了一种基于不完全信息博弈的智能车换道决策方法,首先在时间和空间上,对智能车换道意图和换道可行性进行建模;然后根据换道车辆及其周车的状态信息来建立收益矩阵;收益矩阵的求解采用博弈论中的帕累托最优和纳什均衡进行求解;为了解决不完全信息非合作动态博弈的行为信息未知问题,换道车辆对具有博弈冲突的车辆进行速度及加速度的纵向行为预测,所采用的方法是NARX神经网络模型;换道车辆的周车通过连续隐马尔科夫模型预测换道车辆的横向运动。博弈参与者通过预测他车未来的行为趋势来对收益矩阵的决策进行修正,在决策达到执行的阈值时执行。

    基于深度强化学习的车辆节能运动规划模型及方法

    公开(公告)号:CN115935780A

    公开(公告)日:2023-04-07

    申请号:CN202211124098.2

    申请日:2022-09-15

    申请人: 吉林大学

    IPC分类号: G06F30/27 G06N3/08 G06F111/08

    摘要: 本发明适用于车辆节能运动规划领域,提供了基于深度强化学习的车辆节能运动规划模型,包括:感知模块,获取车辆自身的运动状态信息同时感知模块获取其他交通道路信息;决策模块,利用深度Q网络作为决策算法,将车辆行驶时的纵向性能、车辆行驶时的瞬时能耗和行驶安全性的因素作为奖励函数的设置依据;控制模块,将决策层的控制结果传入Carla中的车辆动力学模型中。基于深度强化学习的车辆节能运动规划方法,包括以下步骤:步骤(1):初始化一个Action‑Value网络和一个Target Action‑Value网络;步骤(2):在每一个训练回合中,Action‑Value网络首先利用算法以概率随机做一个动作进行探索。

    分布式电动汽车电机热保护控制方法

    公开(公告)号:CN112758081B

    公开(公告)日:2022-07-08

    申请号:CN202110134652.4

    申请日:2021-04-02

    申请人: 吉林大学

    摘要: 本发明公开了一种分布式电动汽车电机热保护控制方法,包括以下步骤:根据当前电机温度,判断电机温度是否超过阈值;若没有超过阈值,执行工作模式1:若超出阈值,执行工作模式2;工作模式1,采用基于电机热保护控制策略的电动汽车纵横垂稳定控制方法:建立二自由度模型得到参考行驶状态,通过变结构滑模控制算法计算得到合力矩,然后通过轮胎力分配层将合力矩转化为具体轮胎力,最后由执行机构控制层转化为车辆行驶所需的转矩、车轮转角及主动悬架力;工作模式2,当没有触发电机热保护策略时,进行对车辆正常行驶时车辆稳定性控制:通过建立二自由度参考模型计算参考值,通过分层控制对车辆纵横垂进行控制。

    一种基于路径规划的深度强化学习智能车行为决策方法

    公开(公告)号:CN114153213A

    公开(公告)日:2022-03-08

    申请号:CN202111460431.2

    申请日:2021-12-01

    申请人: 吉林大学

    IPC分类号: G05D1/02

    摘要: 本发明公开了一种基于路径规划的深度强化学习智能车行为决策方法,属于智能车自动驾驶技术领域,所述一种基于路径规划的深度强化学习智能车行为决策方法包括将任务建模为马尔科夫决策过程,搭建深度强化学习算法,智能体输入设计,智能体输出设计,搭建训练网络结构,对任务环境进行路径规划,改进奖励函数,以及训练和测试智能体模型,具有处理复杂决策、简化仿真场景到实际应用的过程、解决了训练速度慢和难以收敛的问题以及提高智能体模型的实际泛化能力的优点。

    分布式电动汽车电机热保护控制方法

    公开(公告)号:CN112758081A

    公开(公告)日:2021-05-07

    申请号:CN202110134652.4

    申请日:2021-01-29

    申请人: 吉林大学

    摘要: 本发明公开了一种分布式电动汽车电机热保护控制方法,包括以下步骤:根据当前电机温度,判断电机温度是否超过阈值;若没有超过阈值,执行工作模式1:若超出阈值,执行工作模式2;工作模式1,采用基于电机热保护控制策略的电动汽车纵横垂稳定控制方法:建立二自由度模型得到参考行驶状态,通过变结构滑模控制算法计算得到合力矩,然后通过轮胎力分配层将合力矩转化为具体轮胎力,最后由执行机构控制层转化为车辆行驶所需的转矩、车轮转角及主动悬架力;工作模式2,当没有触发电机热保护策略时,进行对车辆正常行驶时车辆稳定性控制:通过建立二自由度参考模型计算参考值,通过分层控制对车辆纵横垂进行控制。

    一种基于无模型预测的智能车轨迹跟踪控制方法

    公开(公告)号:CN115291608A

    公开(公告)日:2022-11-04

    申请号:CN202210982674.0

    申请日:2022-08-16

    申请人: 吉林大学

    IPC分类号: G05D1/02

    摘要: 本发明适用于车辆轨迹跟踪控制领域,提供了一种基于无模型预测的智能车轨迹跟踪控制方法,将智能车轨迹跟踪控制问题描述成横向的路径跟踪控制与纵向的速度跟踪控制,根据无模型自适应控制方法,利用智能车轨迹跟踪控制系统被控模块的输入输出数据建立动态线性化模型,结合预测控制的优点,给出多步预测方程并通过滚动优化在线计算控制量,设计无模型预测控制器,将前轮转角和速度控制量输入被控模块中实现对期望轨迹在线跟踪控制。本发明可减小与期望轨迹的偏差,快速跟踪期望轨迹,提高控制精度,满足轨迹跟踪的安全性、快速性和舒适性要求。

    一种基于不完全信息博弈的智能车换道决策方法

    公开(公告)号:CN112907967B

    公开(公告)日:2022-06-10

    申请号:CN202110134918.5

    申请日:2021-01-29

    申请人: 吉林大学

    IPC分类号: G08G1/01 G08G1/16

    摘要: 本发明公开了一种基于不完全信息博弈的智能车换道决策方法,首先在时间和空间上,对智能车换道意图和换道可行性进行建模;然后根据换道车辆及其周车的状态信息来建立收益矩阵;收益矩阵的求解采用博弈论中的帕累托最优和纳什均衡进行求解;为了解决不完全信息非合作动态博弈的行为信息未知问题,换道车辆对具有博弈冲突的车辆进行速度及加速度的纵向行为预测,所采用的方法是NARX神经网络模型;换道车辆的周车通过连续隐马尔科夫模型预测换道车辆的横向运动。博弈参与者通过预测他车未来的行为趋势来对收益矩阵的决策进行修正,在决策达到执行的阈值时执行。