基于Linux的虚拟机内存优化方法、设备及介质

    公开(公告)号:CN118093101A

    公开(公告)日:2024-05-28

    申请号:CN202410487413.0

    申请日:2024-04-23

    IPC分类号: G06F9/455 G06F9/50

    摘要: 本发明公开了基于Linux的虚拟机内存优化方法、设备及介质,属于云计算技术领域,本发明要解决的技术问题为当前KSM回收页面时回收速度慢、缺少进程等级优先级,技术方案为:虚拟机管理器使用madivse系统调用配置虚拟地址空间属性;内核的KSM模块将虚拟机管理器的进程号及虚拟地址空间的数据记录并存入优先级队列;KSM模块扫描时遍历扫描优先级队列;判断优先级队列是否非空;取出队列中优先级最大的元素;判断扫描页面数是否小于M;合并页面;调整临时优先级;修改扫描页面数。

    一种内存故障预测方法、装置、设备及可读存储介质

    公开(公告)号:CN117743013A

    公开(公告)日:2024-03-22

    申请号:CN202311789656.1

    申请日:2023-12-25

    摘要: 本申请公开了一种内存故障预测方法、装置、设备及可读存储介质,该方法包括:按照预设维度获取云中心的原始数据,并清洗原始数据;预设维度包括:公共信息、静态信息、告警信息、日志信息和状态信息;在不同的预设维度下,从清洗后的原始数据中提取故障相关的特征数据;对特征数据进行数据编码处理和/或融合处理,得到故障特征数据;将故障特征数据输入至训练好的模型进行内存故障预测,得到内存故障预测结果。技术效果:由于本申请中数据维度包括公共信息、静态信息、告警信息、日志信息和状态信息,且在数据处理过程中,涉及数据清洗、特征提取、数据编码和融合等处理,可以提高数据间的关联性,从而使得最终的内存故障预测更加准确。

    基于SaltStack容器部署的混合架构集群自动化运维的方法及装置

    公开(公告)号:CN117478496A

    公开(公告)日:2024-01-30

    申请号:CN202311468810.5

    申请日:2023-11-06

    摘要: 本发明涉及自动化运维技术领域,具体为一种基于SaltStack容器部署的混合架构集群自动化运维的方法及装置,包括以下步骤:通过服务层实现节点发现和注册、健康检查、服务网络、自动化运维、调度和管理;有益效果为:本发明提出的基于SaltStack容器部署的混合架构集群自动化运维的方法及装置,基于SaltStack进行混合架构下容器化部署及自动化运维的研究,并通过对SaltStack工具的二次开发和多方验证,完成了针对混合架构下的容器化部署的自动化运维系统,包括批量部署、批量启停服务、批量主机和健康状态的监控等功能;有效降低了人工干预的工作量,提升了部署效率及集群健康管理能力。

    一种集群搭建方法、装置、设备及介质

    公开(公告)号:CN117311974A

    公开(公告)日:2023-12-29

    申请号:CN202311316822.6

    申请日:2023-10-12

    IPC分类号: G06F9/50 G06F9/455

    摘要: 本申请公开了一种集群搭建方法、装置、设备及介质,包括:创建软件源仓库;所述软件源仓库中包括各类型节点所需的软件包;获取资源模板;其中,所述资源模板定义了集群所需云资源;基于所述资源模板部署所述云资源以得到集群的各个节点,并将各个节点对应的软件安装脚本分别推送到各个节点,以便各个节点访问所述软件源仓库,并利用自身获取到的软件安装脚本对自身所需的软件包进行安装。这样,在搭建高性能计算集群时,根据集群需求定义资源模板即可完成集群的搭建,能够提升高性能计算集群的部署效率,降低成本。

    一种基于容器部署的云平台故障处理方法及装置

    公开(公告)号:CN116647438A

    公开(公告)日:2023-08-25

    申请号:CN202310645751.8

    申请日:2023-06-02

    摘要: 本发明涉及云服务技术领域,具体为一种基于容器部署的云平台故障处理方法及装置,包括以下步骤:对接Prometheus用以监控集群中节点状态、OpenStack组件服务状态、计算节点基板管理控制器异常;对接monitor用以监控计算节点存储网、控制网、数据网是否正常;对接K8s的ConfigMap及自研组件Network;有益效果为:本发明提出的基于容器部署的云平台故障处理方法及装置,在云主机或计算节点故障的情况下,能够自动进行故障处理,并且具备一定的云主机自愈能力和服务通知能力,全力保证客户应用稳定高效的运行;有效降低了人工干预的工作量,提升了故障处理效率,同时也避免了故障时由于人工响应速度过慢而导致客户业务不能及时恢复的情况。

    目标检测任务的联合执行方法及装置、介质、设备

    公开(公告)号:CN118606054A

    公开(公告)日:2024-09-06

    申请号:CN202410789879.6

    申请日:2024-06-19

    IPC分类号: G06F9/50 G06V20/40

    摘要: 本发明提供一种目标检测任务的联合执行方法及装置、介质、设备。该方法包括:对每一个视频帧执行目标检测操作,得到视频帧对应的第一目标边界框检测结果;对视频帧进行预处理,并将预处理后的视频帧输入至深度确定性策略梯度算法的策略网络中,得到视频帧需要卸载到云端节点的置信概率;若视频帧需要卸载到云端节点的置信概率大于预设值,则将视频帧和第一目标边界框检测结果发送至云端节点,以使云端节点对视频帧执行目标检测操作,得到第二目标边界框检测结果,并将检测准确度较高的目标边界框检测结果反馈至前端用户,以实现视频帧的目标检测任务的纵向卸载。本发明通过云边协同的纵向卸载,尽可能提升视频流实例的目标检测准确度。

    一种FPGA硬件加速设备使用、管理系统及方法

    公开(公告)号:CN113946441A

    公开(公告)日:2022-01-18

    申请号:CN202111180807.4

    申请日:2021-10-11

    IPC分类号: G06F9/50 G06F21/44

    摘要: 本发明涉及云计算技术领域,具体提供了一种FPGA硬件加速设备使用、管理系统,云服务商提供Host宿主机及FPGA硬件加速设备,Host与FPGA设备通过总线PCIe相连接,FPGA设备的mgmtPF供Host使用,user PF提供给用户的FPGA云服务器虚拟机使用;在FPGA开发环境或FPGA云服务器开发环境进行FPGA业务逻辑镜像开发,通过云平台将FPGA镜像文件bitstream上传到对象存储,或从对象存储将bitstream下载到远程FPGA云服务器业务集群,并将bitstream烧录到业务集群FPGA云服务器的user PF中运行业务逻辑。本发明采用FPGA硬件加速设备将计算负载从CPU转移到FPGA设备上,可以有效降低CPU的业务负载,提高单位功耗的计算效率。

    一种大模型服务的GPU资源调度方法及系统

    公开(公告)号:CN118796473A

    公开(公告)日:2024-10-18

    申请号:CN202410962916.9

    申请日:2024-07-18

    IPC分类号: G06F9/50

    摘要: 本发明涉及计算机技术领域,具体为一种大模型服务的GPU资源调度方法及系统,包括以下步骤:GPU资源状态转换;GPU资源锁定;GPU资源解锁;GPU资源释放;有益效果为:本发明提出的大模型服务的GPU资源调度方法及系统,通过结合Redis的SET、DEL命令和过期时间设置,实现了一个高效、可靠的GPU资源锁定机制。SET命令确保了资源锁定的原子性,避免了并发冲突;而过期时间的设置则有效防止了因服务异常导致的死锁问题,提高了系统的健壮性和可用性。

    多租户共享集群的权限控制方法及装置、介质、设备

    公开(公告)号:CN118713869A

    公开(公告)日:2024-09-27

    申请号:CN202410712507.3

    申请日:2024-06-04

    IPC分类号: H04L9/40 G06F9/50

    摘要: 本发明提供一种多租户共享集群的权限控制方法及装置、介质、设备。该方法包括:在多租户共享Kubernetes集群的场景中,在Kubernetes集群中为每一个租户分配对应的命名空间,以使该租户下的各个用户在所分配的命名空间下创建集群资源;为每一个租户对应的命名空间设置资源配额;其中,所述资源配额用于对该租户下各个用户在创建集群资源时需要用到的计算资源进行限制;为每一个租户中的每一个用户选择匹配的角色;其中,预先定义多种角色,每一种角色具有不同的操作权限;将每一个用户与为该用户选择的角色进行绑定,以使绑定角色后的用户在所属租户对应的命名空间下具有对应的操作权限。本发明可以实现各个用户之间的权限隔离,提高了安全性。

    一种交通行业的大模型问答方法、装置、设备及存储介质

    公开(公告)号:CN118585632A

    公开(公告)日:2024-09-03

    申请号:CN202411067085.5

    申请日:2024-08-06

    摘要: 本申请公开了一种交通行业的大模型问答方法、装置、设备及存储介质,涉及人工智能与信息安全的交叉领域,包括:基于预先构建好的安全知识库对待处理的交通相关问题进行检索;当得到的检索结果表明知识库中不存在与交通相关问题对应的答复信息时,基于预设问题安全拦截策略判断当前是否触发问题拦截操作;当得到的第一判断结果表明不触发时,基于预设prompt对交通相关问题进行问题增强;基于预先完成微调的目标交通大模型对得到的增强后问题进行处理,以得到目标答复信息;根据预设回答安全拦截策略判断当前是否触发与目标答复信息对应的答复拦截操作,以基于得到的第二判断结果完成问答操作。能够有效提高问答的安全性及准确性。