一种基于深度强化学习的软件智能升级方法及装置

    公开(公告)号:CN113031983B

    公开(公告)日:2022-11-11

    申请号:CN202110147585.X

    申请日:2021-02-03

    IPC分类号: G06F8/65 G06K9/62 G06N3/02

    摘要: 本发明提出了一种基于深度强化学习的软件智能升级方法及装置。所述方法包括:采集软件运行参数以及用户操作参数,并确定所述软件运行参数以及用户操作参数下软件的基准升级时间点;根据所述软件运行参数以及用户操作参数,利用策略网络给出预测的升级时间点,将预测的升级时间点和所述基准升级时间点的差值作为强化学习的奖励,并将奖励作为策略网络的标签值,通过训练得到训练好的软件智能升级模型;获取软件实时运行参数和用户操作参数,传入训练好的软件智能升级模型,得到当前升级时间点的可信值,并根据可信值判断是否进行升级。本发明基于强化学习和深度学习,实现软件系统的智能升级时机预测,极大地提高软件升级效率。

    一种基于深度强化学习的软件智能升级方法及装置

    公开(公告)号:CN113031983A

    公开(公告)日:2021-06-25

    申请号:CN202110147585.X

    申请日:2021-02-03

    IPC分类号: G06F8/65 G06K9/62 G06N3/02

    摘要: 本发明提出了一种基于深度强化学习的软件智能升级方法及装置。所述方法包括:采集软件运行参数以及用户操作参数,并确定所述软件运行参数以及用户操作参数下软件的基准升级时间点;根据所述软件运行参数以及用户操作参数,利用策略网络给出预测的升级时间点,将预测的升级时间点和所述基准升级时间点的差值作为强化学习的奖励,并将奖励作为策略网络的标签值,通过训练得到训练好的软件智能升级模型;获取软件实时运行参数和用户操作参数,传入训练好的软件智能升级模型,得到当前升级时间点的可信值,并根据可信值判断是否进行升级。本发明基于强化学习和深度学习,实现软件系统的智能升级时机预测,极大地提高软件升级效率。