一种GPU集群监控系统及监控报警发布方法

    公开(公告)号:CN103780660A

    公开(公告)日:2014-05-07

    申请号:CN201210414718.6

    申请日:2012-10-25

    发明人: 葛鑫 王胜春 李进

    IPC分类号: H04L29/08 H04L12/24 H04L12/26

    摘要: 本发明提供了一种GPU集群监控系统及监控报警发布方法,属于信息技术领域。所述GPU集群监控系统包括数据采集模块、分析模块和展现模块;在GPU集群中的每一个计算节点上均安装有所述数据采集模块,所述数据采集模块采集该计算节点的数据信息,所述数据信息为GPU卡的利用率;所述分析模块设置在所述代理节点上,所述分析模块将所述采集模块采集到的数据信息收集到代理节点当中,并对数据信息进行统计分析,生成精简数据表;所述展现模块设置在所述信息发布服务器上,所述展现模块接收分析模块生成的精简数据表,并建立web平台,将精简数据表以图形的形势直观表现出来,让运维人员实时监控。

    一种计算机集群的健康状态检查和修复方法及存储介质

    公开(公告)号:CN112445677A

    公开(公告)日:2021-03-05

    申请号:CN201910833319.5

    申请日:2019-09-04

    IPC分类号: G06F11/30

    摘要: 本发明公开了计算机集群的健康状态检查和修复方法及存储介质,该方法包括:检查所述计算机集群中各服务器的运行状态,确定在线服务器;检查所述在线服务器的磁盘分区,并修复检查出的所述在线服务器的异常磁盘分区;根据预设的配置文件,检查所述在线服务器的各系统服务,并修复检查出的所述在线服务器的异常系统服务;检查所述在线服务器的内存使用状态,并修复检查出的所述在线服务器的异常内存;检查所述在线服务器的软件环境,并修复检查出的所述在线服务器的异常软件环境。本发明在检查出节点服务器的异常时,及时在线修复异常,无需人工干预,节省人工成本的同时,提高了检测修复的效率,经过本发明的计算机集群的健康状态得到显著的提升。

    一种针对多种应用软件的计算机资源调度方法

    公开(公告)号:CN105320565A

    公开(公告)日:2016-02-10

    申请号:CN201410373241.0

    申请日:2014-07-31

    IPC分类号: G06F9/50

    摘要: 本发明提供了一种针对多种应用软件的计算机资源调度方法,属于计算机领域。该方法包括:(1)按每种应用软件对计算资源的使用需求进行评估,然后将总的计算资源按应用软件的个数划分成若干个大小不等的计算资源池,分别分配给每个应用软件;(2)在应用软件使用过程中,对各种应用软件计算资源的负载量进行监控,当某种应用软件出现所分配的计算资源不够用而其他应用软件有空闲的计算资源时,动态地将其他应用软件当前空闲的计算资源切换给计算资源不够用的应用软件去使用,并在作业结束后将这些计算资源归还给原有的应用软件。

    一种计算机集群的健康状态检查和修复方法及存储介质

    公开(公告)号:CN112445677B

    公开(公告)日:2024-06-18

    申请号:CN201910833319.5

    申请日:2019-09-04

    IPC分类号: G06F11/30

    摘要: 本发明公开了计算机集群的健康状态检查和修复方法及存储介质,该方法包括:检查所述计算机集群中各服务器的运行状态,确定在线服务器;检查所述在线服务器的磁盘分区,并修复检查出的所述在线服务器的异常磁盘分区;根据预设的配置文件,检查所述在线服务器的各系统服务,并修复检查出的所述在线服务器的异常系统服务;检查所述在线服务器的内存使用状态,并修复检查出的所述在线服务器的异常内存;检查所述在线服务器的软件环境,并修复检查出的所述在线服务器的异常软件环境。本发明在检查出节点服务器的异常时,及时在线修复异常,无需人工干预,节省人工成本的同时,提高了检测修复的效率,经过本发明的计算机集群的健康状态得到显著的提升。

    一种针对多种应用软件的计算机资源调度方法

    公开(公告)号:CN105320565B

    公开(公告)日:2018-11-20

    申请号:CN201410373241.0

    申请日:2014-07-31

    IPC分类号: G06F9/50

    摘要: 本发明提供了一种针对多种应用软件的计算机资源调度方法,属于计算机领域。该方法包括:(1)按每种应用软件对计算资源的使用需求进行评估,然后将总的计算资源按应用软件的个数划分成若干个大小不等的计算资源池,分别分配给每个应用软件;(2)在应用软件使用过程中,对各种应用软件计算资源的负载量进行监控,当某种应用软件出现所分配的计算资源不够用而其他应用软件有空闲的计算资源时,动态地将其他应用软件当前空闲的计算资源切换给计算资源不够用的应用软件去使用,并在作业结束后将这些计算资源归还给原有的应用软件。

    一种基于VNC调度的负载均衡方法及其系统

    公开(公告)号:CN105407115A

    公开(公告)日:2016-03-16

    申请号:CN201410446986.5

    申请日:2014-09-03

    IPC分类号: H04L29/08 H04L12/803

    摘要: 本发明提供一种基于VNC调度的负载均衡方法及其方法,用于在多个登陆服务器上创建VNC远程桌面,其特征在于,当创建该VNC远程桌面时,包括步骤:S1、查找具有最小VNC连接数的登陆服务器,该VNC连接数用于表示该登陆服务器上已创建的该VNC远程桌面的个数;S2、扫描具有最小VNC连接数的登陆服务器的性能参数;S3、根据该性能参数判断具有最小VNC连接数的登陆服务器的负载是否过重,如果负载过重则发出警报,否则,直接在具有最小VNC连接数的登陆服务器上创建VNC远程桌面。本发明能使各个登陆服务器上的VNC连接数相近,防止登陆服务器出现负载过重,或没有负载的情况。

    统计分析方法及装置
    10.
    发明公开

    公开(公告)号:CN107844459A

    公开(公告)日:2018-03-27

    申请号:CN201610835256.3

    申请日:2016-09-20

    IPC分类号: G06F17/18

    CPC分类号: G06F17/18

    摘要: 本发明提供一种统计分析方法及装置,其中方法包括:对指定存储位置进行扫描,以获取扫描结果;对扫描结果进行划分,以获取一个或多个分组;对各分组进行调度,以为每个分组分配计算节点;利用计算节点对分组进行计算,以获取计算结果;对计算结果进行统计,以获得统计结果。本发明提供的统计分析方法及装置,统计效率高,且大大节省了人力,能够快速的给用户提供有效的数据报表,从而监控数据中心的存储资源使用情况,来为用户决策提供参考。