一种基于最大熵强化学习的耙吸挖泥船挖掘装舱控制方法
摘要:
本发明公开了一种基于最大熵强化学习的耙吸挖泥船挖掘装舱控制方法,步骤如下:步骤1:获取连续天数的耙吸船挖掘装舱施工数据;步骤2:基于Transformer模型构建耙吸船的环境量预测模型,并对环境量预测模型进行训练,通过环境量预测模型对环境量进行预测;步骤3:构建最大熵强化学习控制模型,将环境预测模型输出结果作为最大熵强化学习控制模型的状态量;步骤4:训练最大熵强化学习控制模型,用训练好的最大熵强化学习控制模型根据实际的耙吸船挖掘装舱施工数据获取挖掘装舱最优控制动作,对耙吸船挖掘装舱进行控制。本发明可以捕捉复杂的环境序列特征,更好地模拟挖泥船挖泥装舱作业中的各种情况和变化,给出最优的控制方法。
0/0