-
公开(公告)号:CN119324927A
公开(公告)日:2025-01-17
申请号:CN202411357646.5
申请日:2024-09-27
Applicant: 暨南大学
IPC: H04L67/1034 , H04L67/1008 , H04L67/101 , H04L67/1021 , H04L67/1029 , H04L67/61 , H04L67/63 , H04L41/0663 , H04L41/14 , H04L41/16 , G06N3/045 , G06N3/092 , G06N3/084 , G06N3/096 , G06N5/01
Abstract: 本发明公开了一种算力网络环境下基于强化学习的微服务容错调度方法;包括针对网络环境中存在的网络主机和链路设备故障的问题,分析基于PB(Primary‑Backup)模型的任务容错调度约束,设计启发式调度算法FAWS,提高系统的容错性,确保任务按时完成。为了提高模型的性能与适应能力,设计了一种基于强化学习的离线到在线的任务容错调度框架。针对模型训练过程中的冷启动问题,利用FAWS的任务运行日志来离线训练离散的soft actor‑critic强化学习模型。针对边缘环境中各服务器之间数据分布不一致的问题,在将DRL模型部署到边缘服务器时,通过联合使用GAE和PPO的方法来在线微调DRL模型,进一步提高模型的决策能力,得到最优调度决策。
-
公开(公告)号:CN118897952A
公开(公告)日:2024-11-05
申请号:CN202410971736.7
申请日:2024-07-19
Applicant: 暨南大学
IPC: G06F18/10 , G06F18/213 , G06F18/214 , G06N20/20
Abstract: 本发明涉及算力网络性能评估技术领域,具体为一种基于层次分析法的算力网络实时性能评估方法。该方法首先建立多层次综合评价指标体系,对服务器节点,从处理器、内存、网络、磁盘等多个一级指标出发,细分为二级和三级指标,如处理器利用率、内存利用率等,对其他层次节点做同样处理。然后,收集算力网络节点的运行数据,进行清洗、归一化处理和噪声消除,得到清洗后的算力特征向量。接着,采用Stacking异质集成学习技术训练模型并进行算力预测,通过加权平均方法逐层汇总评估结果,得到对于整个算力网络性能的总体评估。该方法提高了多层算力网络性能评估的实时性和准确性。
-
公开(公告)号:CN119512759A
公开(公告)日:2025-02-25
申请号:CN202411685487.1
申请日:2024-11-23
Applicant: 暨南大学
Abstract: 本发明公开了一种算力网络中负载感知的多微服务副本弹性伸缩方法,旨在应对动态的在线工作负载环境,保证端到端响应时延满足服务水平协议(SLA)的同时提高微服务资源利用率。该发明首先通过Prometheus、cAdvisor和Istio等插件采集Kubernetes集群中各微服务的历史性能数据,并将这些数据存储于时间序列数据库中,构建训练数据集。随后,根据微服务之间的调用关系和数据集中的微服务特征构建图数据结构,利用图注意力网络训练多微服务CPU利用率和P90响应延迟预测器,从而形成智能体可交互的模拟环境。基于此模拟环境,设计并训练深度上下文多臂赌博机模型,结合上置信界(UCB)策略,在大状态空间和复杂非线性关系中选择最优的副本调整策略,实现多微服务系统的自动水平伸缩。最终,将训练好的模型部署于实际环境中,通过Prometheus定期监测和更新微服务的上下文信息,进行实时副本调整,降低SLA违规风险并提升资源利用率。
-
-