Patent search ap:("国电南瑞科技股份有限公司") AND inv:"杨云飞" Page 1

1.

发明授权
一种基于深度强化学习的软件智能升级方法及装置有权

公开(公告)号：CN113031983B

公开(公告)日：2022-11-11

申请号：CN202110147585.X

申请日：2021-02-03

Applicant: 国电南瑞科技股份有限公司

Inventor： 俞俊 , 许明杰 , 吴小志 , 王召 , 李东辉 , 杨春松 , 杨云飞 , 朱佳

IPC: G06F8/65 , G06K9/62 , G06N3/02

Abstract: 本发明提出了一种基于深度强化学习的软件智能升级方法及装置。所述方法包括：采集软件运行参数以及用户操作参数，并确定所述软件运行参数以及用户操作参数下软件的基准升级时间点；根据所述软件运行参数以及用户操作参数，利用策略网络给出预测的升级时间点，将预测的升级时间点和所述基准升级时间点的差值作为强化学习的奖励，并将奖励作为策略网络的标签值，通过训练得到训练好的软件智能升级模型；获取软件实时运行参数和用户操作参数，传入训练好的软件智能升级模型，得到当前升级时间点的可信值，并根据可信值判断是否进行升级。本发明基于强化学习和深度学习，实现软件系统的智能升级时机预测，极大地提高软件升级效率。

2.

发明公开
一种基于深度强化学习的软件智能升级方法及装置有权

公开(公告)号：CN113031983A

公开(公告)日：2021-06-25

申请号：CN202110147585.X

申请日：2021-02-03

Applicant: 国电南瑞科技股份有限公司

Inventor： 俞俊 , 许明杰 , 吴小志 , 王召 , 李东辉 , 杨春松 , 杨云飞 , 朱佳

IPC: G06F8/65 , G06K9/62 , G06N3/02

Abstract: 本发明提出了一种基于深度强化学习的软件智能升级方法及装置。所述方法包括：采集软件运行参数以及用户操作参数，并确定所述软件运行参数以及用户操作参数下软件的基准升级时间点；根据所述软件运行参数以及用户操作参数，利用策略网络给出预测的升级时间点，将预测的升级时间点和所述基准升级时间点的差值作为强化学习的奖励，并将奖励作为策略网络的标签值，通过训练得到训练好的软件智能升级模型；获取软件实时运行参数和用户操作参数，传入训练好的软件智能升级模型，得到当前升级时间点的可信值，并根据可信值判断是否进行升级。本发明基于强化学习和深度学习，实现软件系统的智能升级时机预测，极大地提高软件升级效率。

Patent Agency Ranking