-
公开(公告)号:CN116431350A
公开(公告)日:2023-07-14
申请号:CN202310416426.4
申请日:2023-04-13
申请人: 威海新北洋数码科技有限公司 , 山东新北洋信息技术股份有限公司 , 西安交通大学
摘要: 本发明公开了一种基于CPU频率指标的容器弹性扩缩容方法及相关装置,属于云计算领域。本发明提供一种基于CPU频率指标的容器弹性扩缩容方法,能够根据容器内部的实际负载情况以及当前的CPU频率及硬件参数,自适应地调整容器的数量,实现对计算资源的高效利用,降低资源浪费和成本,同时减少延迟和资源竞争等问题。通过频率能耗模型计算出的最优CPU频率作为阈值调整容器的数量,使得节点容器能够达到最佳的性能状态,提高容器的运行效率,降低系统的能耗,实现对环境的保护和成本的降低。
-
公开(公告)号:CN116414525A
公开(公告)日:2023-07-11
申请号:CN202310416745.5
申请日:2023-04-13
申请人: 威海新北洋数码科技有限公司 , 山东新北洋信息技术股份有限公司 , 西安交通大学
摘要: 本发明公开了一种高并发推理服务的实施方法、推理方法及相关装置,属于计算机技术领域。本发明在集群中部署收发服务和推理服务,推理服务通过配置化的方式加载对应的模型文件;由收发服务接收并解析用户的推理请求,将请求数据发送到对应的待处理队列中,同时将待推理对象存储到存储服务器中;部署于容器内的多类型多版本的推理服务从对应的队列中获取待的推理信息;推理服务解析推理信息,从存储服务器中获取待推理对象,通过推理算法完成模型推理,得到推理结果;收发服务将推理结果返回给对应请求的用户。本发明通过消息队列的方式,实现推理服务的异步处理,实现了高并发场景下的快速推理,提高了推理速度和并发处理能力。
-
公开(公告)号:CN116450298A
公开(公告)日:2023-07-18
申请号:CN202310433755.X
申请日:2023-04-17
申请人: 威海新北洋数码科技有限公司 , 山东新北洋信息技术股份有限公司 , 西安交通大学
摘要: 本发明公开了一种GPU任务细粒度调度方法及相关装置,属于云计算任务调度领域。本发明对于Kubernetes本身的架构扩展模块,支持具有细粒度分配和明确的资源管理的GPU共享。本发明可以使资源管理器和用户可以明确标识和选择GPU资源。此外,本发明的实现与现有的Kubernetes体系结构兼容,并且包含GPU任务的调度打分策略,从而大大提高了Kubernetes集群GPU任务吞吐率。本发明将上层Kubernetes扩展调度器架构和下层GPU虚拟化策略分离,以模块化的方式进行扩展,实现了快速简洁的部署。在本框架中用户可以以任何分数值指定在共享GPU上的资源需求,并且考虑碎片减缓来分配资源。
-
公开(公告)号:CN116431288A
公开(公告)日:2023-07-14
申请号:CN202310422654.2
申请日:2023-04-14
申请人: 威海新北洋数码科技有限公司 , 山东新北洋信息技术股份有限公司 , 西安交通大学
摘要: 本发明公开了一种基于综合能耗指标的容器弹性扩缩容方法及相关装置,属于服务器集群能耗处理领域。本发明综合考虑容器性能和能源消耗的指标,将计算出的实时综合能耗指标与伸缩规则中设置的第一期望和第二期望大小进行对比,如果综合能耗指标超过第一期望指标时,表示该服务器上的负载已经达到阈值,则采取扩容操作把容器部署在其他集群服务器上,从而降低本服务器负载减少能耗;若该服务器的能耗指标低于第二期望指标,表示目前该服务器负载仍有空余,则进行缩容,将多余的算法容器节约出来,以节省计算资源减少能耗。本发明能够动态的自适应调节容器数量,实现了容器资源的高效管理和能源消耗的优化,适用于云计算等领域的容器应用程序。
-
-
-