一种基于强化学习的智能体无效行为切换抑制方法
摘要:
本发明公开一种基于强化学习的智能体无效行为切换抑制方法,属于航空工程、强化学习领域。通过智能体与仿真环境交互进行数据采样,并基于深度强化学习进行模型训练;将本算法加入模型训练过程,抑制智能体在执行时无效动作切换的产生,平滑强化学习智能体的动作执行机制。本发明能够达到较为明显的智能体无效动作切换抑制效果。
0/0