-
公开(公告)号:CN118488055A
公开(公告)日:2024-08-13
申请号:CN202410630553.9
申请日:2024-05-21
IPC分类号: H04L67/10 , H04L67/101 , H04L67/1008 , H04L67/60 , H04L67/61
摘要: 本发明涉及云边环境中QoS感知的微服自适应在线迁移方法及系统,包括:首先,使用最长加权路径算法识别关键路径,基于CCT方法聚合这些关键路径,以得到待迁移候选微服务集;其次,通过基于关键路径变异系数和响应时间增量系数的倾斜决策树,从待迁移候选微服务集中准确地识别待迁移微服务;最后,使用平衡指标对待迁移微服务之间的网络通信开销以及资源竞争进行综合权衡,在线确定将待迁移微服务迁移到哪一个合适的空闲节点,实现云边环境中QoS感知的微服自适应在线迁移。本发明有助于在突发负载情况下满足QoS要求的基础上,提高系统资源的利用效率。
-
公开(公告)号:CN117640378A
公开(公告)日:2024-03-01
申请号:CN202311621139.3
申请日:2023-11-29
IPC分类号: H04L41/0823 , H04L41/0894 , H04L41/042 , H04L41/046 , H04L41/16 , H04L41/14 , H04L41/50 , H04L67/10 , H04L67/288 , H04L67/51 , H04L67/568
摘要: 本发明涉及云边环境下性能感知的微服务自适应部署和资源分配方法及系统,包括:挖掘有关不同微服务之间的干扰和通信约束;将具有强性能干扰的微服务放置到不同节点以减轻干扰造成的性能损失,并将具有强I/O依赖关系的微服务放置到同一节点内以减少通信开销;在放置结束后,通过定制的基于MADDPG资源分配模型学习资源分配、多用户工作负载特征、微服务之间的依赖程度和差异化SLO之间的关系,在保障多用户工作负载差异化的端到端尾延迟SLO的情况下,协同地为每个微服务进行适当的资源分配。本发明智能地为每个微服务分配适当的资源,进而提高资源利用率。
-
公开(公告)号:CN115033477B
公开(公告)日:2023-06-27
申请号:CN202210644574.7
申请日:2022-06-08
申请人: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学
IPC分类号: H04L67/1012 , H04L67/1074 , H04L41/0631 , H04L43/04 , H04L43/062 , H04L43/0852 , G06F17/15
摘要: 本发明涉及一种面向大规模微服务的性能异常主动检测和处理方法及系统,包括:对微服务的资源使用情况以及运行时信息进行采集,通过采集信息判断微服务应用是否存在性能异常;如果微服务应用存在性能异常,首先,通过采集信息生成微服务历史执行图,然后,基于记忆化搜索对微服务关键路径进行提取,随后,基于部分SLO对关键微服务进行定位,最后,基于离散系数确定关键微服务的关键资源,并增加关键资源的配额,以避免或缓解尾延迟SLO违规。
-
公开(公告)号:CN115037749B
公开(公告)日:2023-07-28
申请号:CN202210644605.9
申请日:2022-06-08
申请人: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学
IPC分类号: H04L67/10 , H04L67/1074 , H04L67/133 , H04L67/63
摘要: 本发明涉及一种大规模微服务智能多资源协同调度方法及系统,包括:采集微服务资源使用信息与微服务运行时信息并进行数据预处理;对资源协同调度进行决策的性能感知的多层联动;对微服务进行资源调度的资源分配。通过自动的信息采集可以实时地感知微服务的资源使用和延迟性能等情况;在此基础上,利用多智能体深度强化学习方法可以捕获各个微服务之间的依赖关系,并根据工作负载的动态变化协同地对每个微服务所使用的多种资源进行弹性细粒度的调整。本发明可以在尽可能保障大规模微服务应用的尾延迟SLO的同时,降低微服务每个资源维度的资源冗余,进而提高整体资源利用率。
-
公开(公告)号:CN115129477A
公开(公告)日:2022-09-30
申请号:CN202210918942.2
申请日:2022-08-01
申请人: 山东省计算中心(国家超级计算济南中心)
摘要: 本发明公开了一种资源高效与服务质量感知的推理服务系统自适应调度方法,包括:深度学习模型自动选择模块利用协同过滤方法预测推理工作负载在不同深度学习模型上运行的推理性能;深度学习模型自动选择模块利用贪婪算法选择满足用户服务质量需求的最优深度学习模型,并将最优深度学习模型部署至容器中为推理服务系统中的推理工作负载服务;协同管理模块利用深度强化学习方法,根据推理工作负载的动态变化,协同地调整GPU资源分配和批量大小设置,本发明可根据用户的需求自动地选择深度学习模型,可根据推理工作负载的动态变化协同地调整GPU资源的分配和批量大小的设置。
-
公开(公告)号:CN115037749A
公开(公告)日:2022-09-09
申请号:CN202210644605.9
申请日:2022-06-08
申请人: 山东省计算中心(国家超级计算济南中心)
IPC分类号: H04L67/10 , H04L67/1074 , H04L67/133 , H04L67/63
摘要: 本发明涉及一种性能感知的大规模微服务智能多资源协同调度方法及系统,包括:采集微服务资源使用信息与微服务运行时信息并进行数据预处理;对资源协同调度进行决策的性能感知的多层联动;对微服务进行资源调度的资源分配。通过自动的信息采集可以实时地感知微服务的资源使用和延迟性能等情况;在此基础上,利用多智能体深度强化学习方法可以捕获各个微服务之间的依赖关系,并根据工作负载的动态变化协同地对每个微服务所使用的多种资源进行弹性细粒度的调整。本发明可以在尽可能保障大规模微服务应用的尾延迟SLO的同时,降低微服务每个资源维度的资源冗余,进而提高整体资源利用率。
-
公开(公告)号:CN115033477A
公开(公告)日:2022-09-09
申请号:CN202210644574.7
申请日:2022-06-08
申请人: 山东省计算中心(国家超级计算济南中心)
摘要: 本发明涉及一种面向大规模微服务的性能异常主动检测和处理方法及系统,包括:对微服务的资源使用情况以及运行时信息进行采集,通过采集信息判断微服务应用是否存在性能异常;如果微服务应用存在性能异常,首先,通过采集信息生成微服务历史执行图,然后,基于记忆化搜索对微服务关键路径进行提取,随后,基于部分SLO对关键微服务进行定位,最后,基于离散系数确定关键微服务的关键资源,并增加关键资源的配额,以避免或缓解尾延迟SLO违规。
-
-
-
-
-
-