具有时延约束任务流场景下的自适应封装与协同推理方法

    公开(公告)号:CN113485803A

    公开(公告)日:2021-10-08

    申请号:CN202110729072.X

    申请日:2021-06-29

    摘要: 本发明公开了一种具有时延约束任务流场景下的自适应封装与协同推理方法,包括如下步骤:建立自适应边缘智能推理模型,包括用于接收任务的终端设备和用于制定任务卸载决策的边缘服务器;构建边缘服务器和终端设备的分支模型,所述分支模型均包括若干个分支,每个分支上均设有划分点和出口点,且出口点设置在每个分支的终端;根据任务的处理流程分别预测任务在终端设备和边缘服务器上的处理时间,以及任务的总处理时间;设定目标函数,若已知任务流的所有信息,采用动态规划的离线算法对目标函数进行优化,否则,采用深度强化学习的在线算法对目标函数进行优化。本发明提高了延迟限制下所权衡完成的任务数量和任务推断的准确性。

    一种面向边缘服务器成本优化的流量调度方法

    公开(公告)号:CN115037956B

    公开(公告)日:2023-03-21

    申请号:CN202210631082.4

    申请日:2022-06-06

    申请人: 天津大学

    摘要: 本发明公开了一种面向边缘服务器成本优化的流量调度方法,包括:读取结算周期时刻数内每个时刻的用户数、每个用户的带宽需求及服务时延;设定时延阈值;基于服务时延与时延阈值绘制拓扑网络图;构建用户的带宽需求队列和每个边缘服务器的带宽需求队列;依次对用户的带宽需求队列中的每个元素对应的带宽需求和该带宽需求是否位于95计费点内所对应时刻的拓扑网络图的属性进行变更,根据变更后的拓扑网络图中有向边的属性计算残差值,利用增广路法和bellman‑ford算法搜索图中的连通路径,直至不存在连通路径;根据每个时刻的拓扑网络图输出各时刻下所有用户的卸载流量值。本发明可在保证用户体验的情况下尽可能降低服务提供商成本。

    基于深度强化学习的边缘计算中计算卸载与资源管理方法

    公开(公告)号:CN113821346B

    公开(公告)日:2023-09-05

    申请号:CN202111121919.2

    申请日:2021-09-24

    申请人: 天津大学

    摘要: 本发明公开了一种基于深度强化学习的边缘计算中计算卸载与资源管理方法,包括如下步骤:基于部分可观察马尔可夫决策过程构建边缘计算通信模型,包括M+N个智能体,M个智能体为边缘节点,N个智能体为用户;根据用户成本最小化和边缘节点效用最大化目标设定目标优化函数;设置时隙长度,时间帧长度,初始化时隙和时间帧;边缘节点和用户分别利用部分可观察马尔可夫决策过程获取资源分配策略和任务卸载策略;根据任务卸载策略和资源分配策略利用参与者‑批评者模型对目标优化函数进行优化;根据优化后的目标优化函数将计算任务进行划分并处理。本发明解决了边缘设备与用户之间的不同利益追求,最大化地确保各自利益。

    基于深度强化学习的边缘计算中计算卸载与资源管理方法

    公开(公告)号:CN113821346A

    公开(公告)日:2021-12-21

    申请号:CN202111121919.2

    申请日:2021-09-24

    申请人: 天津大学

    摘要: 本发明公开了一种基于深度强化学习的边缘计算中计算卸载与资源管理方法,包括如下步骤:基于部分可观察马尔可夫决策过程构建边缘计算通信模型,包括M+N个智能体,M个智能体为边缘节点,N个智能体为用户;根据用户成本最小化和边缘节点效用最大化目标设定目标优化函数;设置时隙长度,时间帧长度,初始化时隙和时间帧;边缘节点和用户分别利用部分可观察马尔可夫决策过程获取资源分配策略和任务卸载策略;根据任务卸载策略和资源分配策略利用参与者‑批评者模型对目标优化函数进行优化;根据优化后的目标优化函数将计算任务进行划分并处理。本发明解决了边缘设备与用户之间的不同利益追求,最大化地确保各自利益。

    用于提升多智能体强化学习边缘计算效果的信息交互方法

    公开(公告)号:CN113641504B

    公开(公告)日:2023-09-01

    申请号:CN202111123522.7

    申请日:2021-09-24

    申请人: 天津大学

    IPC分类号: G06F9/50

    摘要: 本发明公开了一种用于提升多智能体强化学习边缘计算效果的信息交互方法,包括如下步骤:构建基于部分可观察马尔可夫决策过程的边缘计算通信模型;在每个边缘节点上建立用于执行内存读取、内存填充和内存写入操作的共享内存空间;根据用户成本最小化和边缘节点效用最大化目标设定目标优化函数;设置时隙长度,时间帧长度,初始化时隙和时间帧;获取边缘节点的资源分配策略,执行内存填充操作;用户执行内存读取和内存写入操作,同时获取每个用户的计算任务、计算任务数据量和计算能力,获取计算用户的任务卸载策略;利用参与者‑批评者模型对目标优化函数进行优化;对计算任务进行划分并处理。本发明可以使边缘节点和用户的决策效用最大化。

    一种面向边缘服务器成本优化的流量调度方法

    公开(公告)号:CN115037956A

    公开(公告)日:2022-09-09

    申请号:CN202210631082.4

    申请日:2022-06-06

    申请人: 天津大学

    摘要: 本发明公开了一种面向边缘服务器成本优化的流量调度方法,包括:读取结算周期时刻数内每个时刻的用户数、每个用户的带宽需求及服务时延;设定时延阈值;基于服务时延与时延阈值绘制拓扑网络图;构建用户的带宽需求队列和每个边缘服务器的带宽需求队列;依次对用户的带宽需求队列中的每个元素对应的带宽需求和该带宽需求是否位于95计费点内所对应时刻的拓扑网络图的属性进行变更,根据变更后的拓扑网络图中有向边的属性计算残差值,利用增广路法和bellman‑ford算法搜索图中的连通路径,直至不存在连通路径;根据每个时刻的拓扑网络图输出各时刻下所有用户的卸载流量值。本发明可在保证用户体验的情况下尽可能降低服务提供商成本。

    用于提升多智能体强化学习边缘计算效果的信息交互方法

    公开(公告)号:CN113641504A

    公开(公告)日:2021-11-12

    申请号:CN202111123522.7

    申请日:2021-09-24

    申请人: 天津大学

    IPC分类号: G06F9/50

    摘要: 本发明公开了一种用于提升多智能体强化学习边缘计算效果的信息交互方法,包括如下步骤:构建基于部分可观察马尔可夫决策过程的边缘计算通信模型;在每个边缘节点上建立用于执行内存读取、内存填充和内存写入操作的共享内存空间;根据用户成本最小化和边缘节点效用最大化目标设定目标优化函数;设置时隙长度,时间帧长度,初始化时隙和时间帧;获取边缘节点的资源分配策略,执行内存填充操作;用户执行内存读取和内存写入操作,同时获取每个用户的计算任务、计算任务数据量和计算能力,获取计算用户的任务卸载策略;利用参与者‑批评者模型对目标优化函数进行优化;对计算任务进行划分并处理。本发明可以使边缘节点和用户的决策效用最大化。