专利检索 ap:("武汉大学") AND inv:"张竞哲" 第 1 页

1.

发明公开
一种基于后决策状态深度强化学习的任务卸载方法审中-实审

公开(公告)号：CN115016858A

公开(公告)日：2022-09-06

申请号：CN202210572305.4

申请日：2022-05-24

申请人： 武汉大学

发明人： 张竞哲 , 贺晓帆 , 张晨 , 周嘉曦

IPC分类号： G06F9/445 , G06F9/50

摘要： 本发明公开了一种基于后决策状态深度强化学习的任务卸载方法，可以对卸载动作的各个维度进行决策，如任务的卸载对象、卸载数量等。面向不同的优化目标，通过改变成本函数，可以实现不同的目标下的最优策略。本发明利用了DQN的经验回放机制，随机选取收集的历史经验作为训练样本提高学习效率。同时，也利用了后决策状态学习框架和额外的热启动过程加快学习速度。传统的后决策学习框架虽然有较高的学习效率，但需要额外的先验信息。本发明提出了一种基于后决策状态深度强化学习的任务卸载方法，利用一个额外的学习过程来获取传统后决策学习中需要的额外信息，通过利用高效的后决策状态学习框架，热启动过程及经验回放机制实现了卸载方法的快速收敛。

2.

发明授权
一种基于后决策状态深度强化学习的任务卸载方法有权

公开(公告)号：CN115016858B

公开(公告)日：2024-03-29

申请号：CN202210572305.4

申请日：2022-05-24

申请人： 武汉大学

发明人： 张竞哲 , 贺晓帆 , 张晨 , 周嘉曦

IPC分类号： G06F9/445 , G06F9/50

摘要： 本发明公开了一种基于后决策状态深度强化学习的任务卸载方法，可以对卸载动作的各个维度进行决策，如任务的卸载对象、卸载数量等。面向不同的优化目标，通过改变成本函数，可以实现不同的目标下的最优策略。本发明利用了DQN的经验回放机制，随机选取收集的历史经验作为训练样本提高学习效率。同时，也利用了后决策状态学习框架和额外的热启动过程加快学习速度。传统的后决策学习框架虽然有较高的学习效率，但需要额外的先验信息。本发明提出了一种基于后决策状态深度强化学习的任务卸载方法，利用一个额外的学习过程来获取传统后决策学习中需要的额外信息，通过利用高效的后决策状态学习框架，热启动过程及经验回放机制实现了卸载方法的快速收敛。

3.

实用新型
一种基于电化学法的开关柜气相检测装置失效

公开(公告)号：CN211785302U

公开(公告)日：2020-10-27

申请号：CN201921971357.9

申请日：2019-11-15

申请人： 武汉大学

发明人： 龚立 , 蒋究 , 张竞哲 , 王文韵 , 韦迪潇

IPC分类号： G01N27/416

摘要： 本实用新型提出了一种基于电化学法的开关柜气相检测装置，包括：气路管道、气体过滤管道、气体分离管道、多个模拟气体传感器、多个数字气体传感器、测量接线端子、分析接线端子、转接头端子、模数转换模块、微处理器、模拟USB接口、数字USB接口、微型显示器、按键模块、预警提示模块、电机、风扇。本专利选用开关柜内气体进行采集、过滤、分离后再分析其浓度信息；本专利能在开关柜运行状态下检测开关柜柜体运行状况，极大缩短检修人员的检修周期，减少非带电检测带来的损失，并能排除气体组分间的干扰，且受开关柜柜内的强电磁场影响小，检测结果可靠。