一种基于深度强化学习的换挡策略动态优化方法

    公开(公告)号:CN110716550A

    公开(公告)日:2020-01-21

    申请号:CN201911076016.X

    申请日:2019-11-06

    Abstract: 本发明属于工程机械及车辆工程领域,具体涉及一种基于深度强化学习的换挡策略动态优化方法。包括如下步骤:(1):确定换挡策略状态输入变量和动作输出变量;(2):根据状态输入变量和动作输出变量,确定换挡策略马尔科夫决策过程;(3):根据换挡策略目标建立强化学习换挡策略奖励函数;(4):根据马尔科夫决策过程和奖励函数,求解深度强化学习换挡策略;(5):将步骤(4)计算出的预测Q网络放入换挡策略控制器,工程机械及车辆在行驶过程中,工程机械及车辆根据换挡策略控制器选择挡位;(6):在行驶过程中定期更新预测Q网络。本发明通过深度强化学习方法对换挡策略进行更新,实现换挡策略的动态优化。

    集成神经网络与物理系统模型的换挡负载动态模拟方法

    公开(公告)号:CN110298073B

    公开(公告)日:2022-07-22

    申请号:CN201910421689.8

    申请日:2019-05-21

    Abstract: 本发明提供了一种集成神经网络与物理系统模型的换挡负载动态模拟方法,该方法将换挡负载分解为挂挡方向负载和选挡方向负载,并根据负载特点建立神经网络挂挡负载模型和阻尼系统选挡负载模型。神经网络挂挡负载模型输入为归一化挂挡位移和归一化挂挡速度,输出为归一化挂挡负载,经反归一化处理后成为挂挡负载。阻尼系统选挡负载模型根据选挡速度计算出选挡负载。最后通过挂挡负载和选挡负载计算出换挡负载。本发明将换挡负载分解为挂挡方向负载和选挡方向负载,并将具有强非线性和时变特性的挂挡方向负载通过神经网络进行拟合,实用性好。以该方法可以更好的模拟出换挡过程中的换挡负载变化情况。

    一种集成模糊神经网络的自适应路径跟踪方法

    公开(公告)号:CN110989597B

    公开(公告)日:2022-06-10

    申请号:CN201911233698.0

    申请日:2019-12-05

    Abstract: 本发明提供了一种集成模糊神经网络的自适应路径跟踪方法,该方法通过判断工程机械或车辆实际位置点的与期望路径的横向位移偏差大小,决定出理想的偏转角度,将目标路径坐标点的曲率以及与实际行驶路径坐标点的横向偏差作为状态切换器的输入,状态切换器判断出工程机械或车辆是否偏离理想路径,再计算出理想偏转角度,横向控制器内部通过训练神经网络得出Jacobian信息,通过该信息整定自抗扰控制器参数,输出模糊神经自抗扰控制律,最后将控制律输入工程机械及车辆动力学模型中,该动力学模型输出实际行驶路径点反馈回输入端,形成完整的闭环控制系统。本发明可以增强控制器的抗干扰能力以及自适应性,提高对目标路径的跟踪精度。

    一种机器人驾驶车辆集成协调控制方法

    公开(公告)号:CN109991856B

    公开(公告)日:2022-04-08

    申请号:CN201910338665.6

    申请日:2019-04-25

    Abstract: 本发明提供了一种机器人驾驶车辆集成协调控制方法,包括:建立机器人驾驶车辆动力学模型;建立考虑模型不确定性和外部干扰的机器人驾驶车辆动力学模型;建立驾驶员车速控制行为模型和驾驶员转向操纵行为模型;采用模糊滑模理论设计机器人驾驶车辆的车速控制器;采用鲁棒反演理论设计机器人驾驶车辆的转向控制器;分别为车速控制和转向控制设计干扰观测器;设计将发动机驱动力控制转换为油门机械腿控制、制动力控制转换为制动机械腿控制、以及前轮转角控制转换为转向机械手控制的控制转换函数;设计用于协调控制机器人驾驶车辆车速与转向的策略。

    一种基于深度强化学习的换挡策略动态优化方法

    公开(公告)号:CN110716550B

    公开(公告)日:2022-07-22

    申请号:CN201911076016.X

    申请日:2019-11-06

    Abstract: 本发明属于工程机械及车辆工程领域,具体涉及一种基于深度强化学习的换挡策略动态优化方法。包括如下步骤:(1):确定换挡策略状态输入变量和动作输出变量;(2):根据状态输入变量和动作输出变量,确定换挡策略马尔科夫决策过程;(3):根据换挡策略目标建立强化学习换挡策略奖励函数;(4):根据马尔科夫决策过程和奖励函数,求解深度强化学习换挡策略;(5):将步骤(4)计算出的预测Q网络放入换挡策略控制器,工程机械及车辆在行驶过程中,工程机械及车辆根据换挡策略控制器选择挡位;(6):在行驶过程中定期更新预测Q网络。本发明通过深度强化学习方法对换挡策略进行更新,实现换挡策略的动态优化。

    一种集成模糊神经网络的自适应路径跟踪方法

    公开(公告)号:CN110989597A

    公开(公告)日:2020-04-10

    申请号:CN201911233698.0

    申请日:2019-12-05

    Abstract: 本发明提供了一种集成模糊神经网络的自适应路径跟踪方法,该方法通过判断工程机械或车辆实际位置点的与期望路径的横向位移偏差大小,决定出理想的偏转角度,将目标路径坐标点的曲率以及与实际行驶路径坐标点的横向偏差作为状态切换器的输入,状态切换器判断出工程机械或车辆是否偏离理想路径,再计算出理想偏转角度,横向控制器内部通过训练神经网络得出Jacobian信息,通过该信息整定自抗扰控制器参数,输出模糊神经自抗扰控制律,最后将控制律输入工程机械及车辆动力学模型中,该动力学模型输出实际行驶路径点反馈回输入端,形成完整的闭环控制系统。本发明可以增强控制器的抗干扰能力以及自适应性,提高对目标路径的跟踪精度。

    一种集成驾驶员决策行为的智能操纵方法

    公开(公告)号:CN110989346A

    公开(公告)日:2020-04-10

    申请号:CN201911233699.5

    申请日:2019-12-05

    Abstract: 本发明提供了一种集成驾驶员决策行为的智能转向操纵方法,把转向过程分为角度决策模块以及角速度决策模块得出理想的偏转角度,将该偏转角度作为工程机械及车辆模型的输入,完成路径跟踪,将航向角偏差与路径偏差作为调整角度策略模块的输入,得出偏转角度值大小,再根据航向角偏差与路径偏差的正负得出偏转角度的方向,将偏转角度以及行驶速度作为调整角速度策略模块的输入,建立双输入单输出的偏转角速度模糊控制器,输出理想的偏转角速度,最后将偏转角度作为工程机械及车辆模型的输入,输出实际路径点以及航向角反馈回输入端,形成完整的闭环系统。本发明鲁棒性强、实用性好,该方法可以更符合驾驶员推理和决策行为。

    一种机器人驾驶车辆集成协调控制方法

    公开(公告)号:CN109991856A

    公开(公告)日:2019-07-09

    申请号:CN201910338665.6

    申请日:2019-04-25

    Abstract: 本发明提供了一种机器人驾驶车辆集成协调控制方法,包括:建立机器人驾驶车辆动力学模型;建立考虑模型不确定性和外部干扰的机器人驾驶车辆动力学模型;建立驾驶员车速控制行为模型和驾驶员转向操纵行为模型;采用模糊滑模理论设计机器人驾驶车辆的车速控制器;采用鲁棒反演理论设计机器人驾驶车辆的转向控制器;分别为车速控制和转向控制设计干扰观测器;设计将发动机驱动力控制转换为油门机械腿控制、制动力控制转换为制动机械腿控制、以及前轮转角控制转换为转向机械手控制的控制转换函数;设计用于协调控制机器人驾驶车辆车速与转向的策略。

    集成传热单元和检测单元的微流体反应器

    公开(公告)号:CN104888675A

    公开(公告)日:2015-09-09

    申请号:CN201510309094.5

    申请日:2015-06-08

    Abstract: 本发明公开了一种集成传热单元和检测单元的微流体反应器,包括依次叠放设置的反应器上盖板,在板材两端分别刻有进液通道和出液通道的混合流体进出口层,在板材上刻有反应通道的流体反应层,隔板,在板材上刻有热传导通道的热传导流体流动层,在板材的一端分别刻有进液和出液通道的热传导流体进出口层和反应器下盖板,进液通道内嵌入的软管通过分流连接器与反应通道内的软管连通,并延伸至出液通道,热传导通道和进出液通道被一根软管贯穿,光纤检测器与反应通道内的软管相接触;本发明可采用嵌段流技术合成具有特定形貌、尺寸微小的含能材料晶体,且制作简单快捷、易组装拆卸、易清洗更换。

Patent Agency Ranking