-
公开(公告)号:CN114815755B
公开(公告)日:2024-10-22
申请号:CN202210576950.3
申请日:2022-05-25
申请人: 天津大学
IPC分类号: G05B19/418
摘要: 本发明公开了一种基于智能协作推理的分布式实时智能监控系统的建立方法,包括:利用横向分割和纵向分割算法建立基于深度神经网络的横向和纵向分割模型;将横向分割点决策、横向执行节点决策、纵向执行节点决策构建为马尔科夫决策过程;基站利用DDQN算法以最小化任务处理时间差为目标构建分割点执行设备决策模型;各监控终端将视频流输入决策模型,并将视频流上传到横向执行节点,横向执行节点利用横向分割模型进行横向分割和执行,并将执行后的网络参数发送纵向执行节点;纵向执行节点根据利用垂直分割算法对纵向执行网络进行纵向分割和执行;云接收来自各纵向执行节点的执行结果,并利用轨迹匹配算法完成跨相机轨迹匹配。本发明提高了系统算力的有效利用率。
-
公开(公告)号:CN115941425A
公开(公告)日:2023-04-07
申请号:CN202211223863.6
申请日:2022-09-30
申请人: 天津大学
IPC分类号: H04L41/0246 , H04L41/0823 , H04L41/0893 , H04L41/14 , H04L41/16 , H04L67/60
摘要: 本发明公开了一种基于社会化学习的云边协同服务编排与请求调度优化方法,包括:eAPs和云分别构建请求调度决策模型和服务编排决策模型;云结合eAP发送的第一共振信息利用注意力机制得状态生成第二共振信息传到eAP;将状态输入服务编排决策模型并优化,结合eAP发送的下层指导向量得到最优服务编排决策传到边缘服务器;eAP结合云发送的第二共振信息利用注意力机制得状态生成第一共振信息传到云;将状态输入请求调度决策模型并优化,结合云发送的上层指导向量得到最优请求调度决策传到边缘服务器;边缘服务器根据收到的两个决策对请求进行处理。本发明能有效降低调度成本,提高吞吐量。
-
公开(公告)号:CN114143212B
公开(公告)日:2022-09-16
申请号:CN202111425250.6
申请日:2021-11-26
申请人: 天津大学
摘要: 本发明公开了一种面向智慧城市的社会化学习方法,包括:构建分层社会化学习系统;基于深度强化学习建立任务评估模型,利用所有物联网设备的任务状态和信道状态优化任务评估模型获得基本决策;边缘服务器利用联邦学习边缘聚合接收的任务评估模型,并根据基本决策优化边缘服务器上的任务评估模型获得高层决策;边缘服务器利用迁移学习对物联网设备中的模型进行指导;云服务器利用联邦学习云聚合接收到的任务评估模型,根据高层决策和云服务器上的任务评估模型制定市级决策,并利用迁移学习对边缘服务器上任务评估模型进行指导。本发明利用联邦学习提高层内智能体间的协作,层间利用迁移学习实现了上层对下层的引导,提高了模型的性能。
-
公开(公告)号:CN113992692B
公开(公告)日:2022-09-06
申请号:CN202111257828.1
申请日:2021-10-27
申请人: 天津大学
摘要: 本发明公开了一种端边云架构和不完全信息下分层联邦学习的方法及系统,包括:基于契约理论构建边缘聚合器和终端设备之间、云服务器和边缘聚合器之间的分层契约博弈模型;终端设备通过边缘聚合器下载云服务器中的电力数据学习模型;基于分层联邦学习算法构建模型演化函数;以满足个体理性、激励兼容和效用最大化为目标求解三方的最优契约;终端设备将基于最优契约更新后的模型发送到边缘聚合器,边缘聚合器基于最优契约对终端设备进行激励发放,并将聚合后的模型发送到云服务器,云服务器基于最优契约对边缘聚合器进行激励发放,并将模型进行再次聚合。本发明可向终端设备和边缘聚合器提供报酬,实现合理公平的收益分配。
-
公开(公告)号:CN113992676B
公开(公告)日:2022-09-06
申请号:CN202111256017.X
申请日:2021-10-27
申请人: 天津大学
IPC分类号: H04L67/10 , H04L67/1004 , G06N20/00 , G06N3/04 , G06N3/08
摘要: 本发明公开了一种端边云架构和完全信息下分层联邦学习的激励方法及系统,包括:基于斯塔克伯格博弈建立终端设备、边缘聚合器和云服务器之间的三层博弈模型;终端设备通过边缘聚合器下载云服务器中的电力数据学习模型;基于分层联邦学习算法构建模型演化函数;利用纳什均衡求解三方的最优策略,使终端设备的效用、边缘聚合器的效用和云服务器的效用达到最大化;终端设备将基于最优策略更新后的模型发送到边缘聚合器,边缘聚合器基于最优策略对终端设备进行激励发放,并将聚合后的模型发送到云服务器,云服务器基于最优策略对边缘聚合器进行激励发放,并将模型进行再次聚合。本发明可向终端设备和边缘聚合器提供报酬,实现合理公平的收益分配。
-
公开(公告)号:CN117952190B
公开(公告)日:2024-07-23
申请号:CN202410135781.9
申请日:2024-01-31
申请人: 天津大学
IPC分类号: G06N3/098 , G06N3/096 , G06N3/0464 , G06N5/01
摘要: 本发明公开了一种面向大模型神经架构搜索的联邦协同训练方法,属于联邦协同训练技术领域,包括以下步骤:步骤1、在云端进行NAS工作,以大模型拆分的残差块作为搜索空间,拼凑最优模型架构;步骤2、根据各个边缘设备的条件限制,将云端的模型按照预设的退出点切分为适合在边缘设备上进行对应场景训练的较小模型并分配;步骤3、分配得到模型后训练,通过距离聚合,按权重将参数聚合至云端;步骤4、未能聚合的参数,通过知识蒸馏的方式,将参数蒸馏至云端;步骤5、通过节能机制调整边缘设备模型训练过程中的迭代次数,加速模型的收敛。本发明提供了一种面向大模型神经架构搜索的联邦协同训练方法,为实现绿色、高效的边缘计算提供一种新的路径。
-
公开(公告)号:CN114815755A
公开(公告)日:2022-07-29
申请号:CN202210576950.3
申请日:2022-05-25
申请人: 天津大学
IPC分类号: G05B19/418
摘要: 本发明公开了一种基于智能协作推理的分布式实时智能监控系统的建立方法,包括:利用横向分割和纵向分割算法建立基于深度神经网络的横向和纵向分割模型;将横向分割点决策、横向执行节点决策、纵向执行节点决策构建为马尔科夫决策过程;基站利用DDQN算法以最小化任务处理时间差为目标构建分割点执行设备决策模型;各监控终端将视频流输入决策模型,并将视频流上传到横向执行节点,横向执行节点利用横向分割模型进行横向分割和执行,并将执行后的网络参数发送纵向执行节点;纵向执行节点根据利用垂直分割算法对纵向执行网络进行纵向分割和执行;云接收来自各纵向执行节点的执行结果,并利用轨迹匹配算法完成跨相机轨迹匹配。本发明提高了系统算力的有效利用率。
-
公开(公告)号:CN113641504A
公开(公告)日:2021-11-12
申请号:CN202111123522.7
申请日:2021-09-24
申请人: 天津大学
IPC分类号: G06F9/50
摘要: 本发明公开了一种用于提升多智能体强化学习边缘计算效果的信息交互方法,包括如下步骤:构建基于部分可观察马尔可夫决策过程的边缘计算通信模型;在每个边缘节点上建立用于执行内存读取、内存填充和内存写入操作的共享内存空间;根据用户成本最小化和边缘节点效用最大化目标设定目标优化函数;设置时隙长度,时间帧长度,初始化时隙和时间帧;获取边缘节点的资源分配策略,执行内存填充操作;用户执行内存读取和内存写入操作,同时获取每个用户的计算任务、计算任务数据量和计算能力,获取计算用户的任务卸载策略;利用参与者‑批评者模型对目标优化函数进行优化;对计算任务进行划分并处理。本发明可以使边缘节点和用户的决策效用最大化。
-
公开(公告)号:CN116009990B
公开(公告)日:2024-03-29
申请号:CN202310088345.6
申请日:2023-02-01
申请人: 天津大学
IPC分类号: G06F9/445
摘要: 本发明公开了一种基于宽注意力机制的云边协同元强化学习计算卸载方法,包括:根据用户设备生成的各计算任务之间的依赖关系构建任务执行图;以任务总延迟、任务处理总能耗以及计算任务与所卸载资源池之间的匹配度的权衡为目标构建卸载目标函数;将任务的卸载过程建模为马尔可夫决策过程,根据卸载目标函数、执行任务图定义状态、动作和奖励函数;构建宽注意力机制的seq2seq神经网络,将任务执行图输入seq2seq神经网络中,利用近端策略优化方法对卸载目标函数进行优化输出最优调度决策,同时利用元强化学习算法对近端策略优化方法的参数进行更新。本发明使具有依赖关系的任务可以在本地执行,也可在细粒度资源池上执行,提高了能效。
-
公开(公告)号:CN117407132A
公开(公告)日:2024-01-16
申请号:CN202311150720.1
申请日:2023-09-07
申请人: 天津大学
摘要: 本发明公开了一种基于社会化学习的边缘云计算任务调度优化方法,包括:S1,构建分层智能体协同学习系统;S2,初始化调度次数t=1,设置编排周期β及工作周期τ;S3,云基于服务编排模型生成服务编排决策发送eAP;S4,eAP根据边缘服务器的可用资源状态生成下层指导信息发到云;S5,云更新服务编排决策,编排边缘服务器的服务;S6,eAP基于任务调度模型生成任务调度决策发送云;S7,云生成上层指导信息发送eAP;S8,eAP更新任务调度决策,处理任务;S9,执行t=t+1,判断t%β==0,若不,执行S6,否则判断τ%t==0,如不,执行S3,否则结束。本发明可以提高服务编排与请求调度的决策能力。
-
-
-
-
-
-
-
-
-