一种基于改进ε-greedy策略和强化学习的矿用无人驾驶电机车速度控制方法

    公开(公告)号:CN116424341A

    公开(公告)日:2023-07-14

    申请号:CN202310326046.1

    申请日:2023-03-29

    Abstract: 本发明公开了一种基于改进ε‑greedy策略和强化学习的矿用无人驾驶电机车速度控制方法,包括:将矿用无人驾驶电机车作为智能体,智能体动作设置为电机车施加在车轴上的最佳驱动/制动力矩范围内整数;分别设计智能体动作、状态及奖励函数,利用Q‑Learning算法以电机车实时状态信息为输入,以施加在车轴上的驱动/制动力矩和智能体所获得的奖励值为输出,完成矿用无人驾驶电机车速度控制的主体算法结构搭建,确保矿用电机车在复杂、不确定的工况环境下自主完成安全跟车、有效避障等行为;通过对ε‑greedy策略的改进,有效提高矿用电机车强化学习算法的学习效率,在更少的迭代次数下达到更优的控制效果。

Patent Agency Ranking