一种基于强化学习的电力物资检定排产方法
Abstract:
本发明公开了一种基于强化学习的电力物资检定排产方法,涉及电力物资管理技术领域,包括通过获取待检定电力物资的状态信息,并根据状态信息得到状态空间;根据电力物资与检定设备的分配检定决策设定动作空间;根据电力物资在检定排产过程的影响因素,构建评价智能体动作效果的奖励函数;根据状态空间、动作空间和奖励函数,创建深度Q网络算法模型作为智能体;通过在已构建的环境中对智能体进行强化学习训练,得到根据最优策略进行电力物资检定排产的智能体;将训练好的智能体部署到电力生产系统中,自动调整检定排产策略。本发明利用强化学习算法实现了多维度评价智能体以最优策略进行电力物资检定排产。
Patent Agency Ranking
0/0