基于深度强化学习的智能车速度决策方法及其仿真方法
摘要:
本发明公开了一种基于深度强化学习方法的智能车速度决策方法,构造智能车通过路口的马尔可夫决策模型的状态空间S,动作空间A,即时奖赏空间R;初始化神经网络,构建经验池;采用ε‑greedy算法进行动作的选择,并将此次经验填加进所述步骤二构建的经验池;从经验池随机选出一部分经验,采用随机梯度下降法训练神经网络;根据最新神经网络完成当前时刻智能车的速度决策,并将此次经验填加至经验池,随机选取一部分经验再进行新一轮神经网络的训练。本发明同时公开了一种基于深度强化学习的智能车速度决策方法的仿真方法,基于matlab自动驾驶工具箱搭建的深度强化学习仿真系统进行仿真实验。
0/0