用于提升多智能体强化学习边缘计算效果的信息交互方法

发明公开

CN113641504A 用于提升多智能体强化学习边缘计算效果的信息交互方法审中-实审

请登陆查看更多内容

专利标题： 用于提升多智能体强化学习边缘计算效果的信息交互方法
申请号： CN202111123522.7

申请日： 2021-09-24
公开(公告)号： CN113641504A

公开(公告)日： 2021-11-12
发明人: 刘志成 , 李沅泽 , 赵云凤 , 宋金铎 , 王晓飞 , 仇超
申请人： 天津大学
申请人地址： 天津市南开区卫津路92号
专利权人： 天津大学
当前专利权人： 天津大学
当前专利权人地址： 天津市南开区卫津路92号
代理机构： 济南光启专利代理事务所
代理商 张瑜
主分类号： G06F9/50
IPC分类号： G06F9/50

摘要：

本发明公开了一种用于提升多智能体强化学习边缘计算效果的信息交互方法，包括如下步骤：构建基于部分可观察马尔可夫决策过程的边缘计算通信模型；在每个边缘节点上建立用于执行内存读取、内存填充和内存写入操作的共享内存空间；根据用户成本最小化和边缘节点效用最大化目标设定目标优化函数；设置时隙长度，时间帧长度，初始化时隙和时间帧；获取边缘节点的资源分配策略，执行内存填充操作；用户执行内存读取和内存写入操作，同时获取每个用户的计算任务、计算任务数据量和计算能力，获取计算用户的任务卸载策略；利用参与者‑批评者模型对目标优化函数进行优化；对计算任务进行划分并处理。本发明可以使边缘节点和用户的决策效用最大化。

公开/授权文献

CN113641504B 用于提升多智能体强化学习边缘计算效果的信息交互方法公开/授权日：2023-09-01

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06F	电数字数据处理（基于特定计算模型的计算机系统入G06N）
G06F9/00	程序控制装置，例如，控制单元（用于外部设备的程序控制入G06F13/10）
G06F9/06	.应用存入的程序的，即应用处理设备的内部存储来接收程序并保持程序的
G06F9/46	..多道程序装置
G06F9/50	...资源分配，例如，中央处理单元[CPU]的