一种新型电力变压器故障模糊Q学习推理方法
摘要:
本发明公开了一种新型电力变压器故障模糊Q学习推理方法,包括:建立电力变压器故障Q学习形式方程;根据环境状态s选择动作a,并观察瞬时奖赏r和新状态s,将Q学习形式方程进行更新;定义模糊推理系统规则库;假设模糊推理系统规则库中结果向量表示连续空间的特征点向量,通过模糊推理,得到每一个特征点的总权值;采用重心法得到步骤模糊推理系统规则中每一个特征点的总权值的输出Y;将模糊推理系统规则中每一个特征点的总权值的输出Y;Q学习形式更新方程,得到权值更新公式;反复进行权值更新,直至权指表收敛,完成新型电力变压器故障模糊Q学习推理。本发明通过学习每个电力变压器故障“状态—动作”从而不断调整决策。
0/0