一种基于后决策状态深度强化学习的任务卸载方法

    公开(公告)号:CN115016858A

    公开(公告)日:2022-09-06

    申请号:CN202210572305.4

    申请日:2022-05-24

    申请人: 武汉大学

    IPC分类号: G06F9/445 G06F9/50

    摘要: 本发明公开了一种基于后决策状态深度强化学习的任务卸载方法,可以对卸载动作的各个维度进行决策,如任务的卸载对象、卸载数量等。面向不同的优化目标,通过改变成本函数,可以实现不同的目标下的最优策略。本发明利用了DQN的经验回放机制,随机选取收集的历史经验作为训练样本提高学习效率。同时,也利用了后决策状态学习框架和额外的热启动过程加快学习速度。传统的后决策学习框架虽然有较高的学习效率,但需要额外的先验信息。本发明提出了一种基于后决策状态深度强化学习的任务卸载方法,利用一个额外的学习过程来获取传统后决策学习中需要的额外信息,通过利用高效的后决策状态学习框架,热启动过程及经验回放机制实现了卸载方法的快速收敛。

    一种基于后决策状态深度强化学习的任务卸载方法

    公开(公告)号:CN115016858B

    公开(公告)日:2024-03-29

    申请号:CN202210572305.4

    申请日:2022-05-24

    申请人: 武汉大学

    IPC分类号: G06F9/445 G06F9/50

    摘要: 本发明公开了一种基于后决策状态深度强化学习的任务卸载方法,可以对卸载动作的各个维度进行决策,如任务的卸载对象、卸载数量等。面向不同的优化目标,通过改变成本函数,可以实现不同的目标下的最优策略。本发明利用了DQN的经验回放机制,随机选取收集的历史经验作为训练样本提高学习效率。同时,也利用了后决策状态学习框架和额外的热启动过程加快学习速度。传统的后决策学习框架虽然有较高的学习效率,但需要额外的先验信息。本发明提出了一种基于后决策状态深度强化学习的任务卸载方法,利用一个额外的学习过程来获取传统后决策学习中需要的额外信息,通过利用高效的后决策状态学习框架,热启动过程及经验回放机制实现了卸载方法的快速收敛。

    一种基于电化学法的开关柜气相检测装置

    公开(公告)号:CN211785302U

    公开(公告)日:2020-10-27

    申请号:CN201921971357.9

    申请日:2019-11-15

    申请人: 武汉大学

    IPC分类号: G01N27/416

    摘要: 本实用新型提出了一种基于电化学法的开关柜气相检测装置,包括:气路管道、气体过滤管道、气体分离管道、多个模拟气体传感器、多个数字气体传感器、测量接线端子、分析接线端子、转接头端子、模数转换模块、微处理器、模拟USB接口、数字USB接口、微型显示器、按键模块、预警提示模块、电机、风扇。本专利选用开关柜内气体进行采集、过滤、分离后再分析其浓度信息;本专利能在开关柜运行状态下检测开关柜柜体运行状况,极大缩短检修人员的检修周期,减少非带电检测带来的损失,并能排除气体组分间的干扰,且受开关柜柜内的强电磁场影响小,检测结果可靠。