一种整机柜硬件监控方法及装置
    1.
    发明公开

    公开(公告)号:CN118295877A

    公开(公告)日:2024-07-05

    申请号:CN202410525890.1

    申请日:2024-04-28

    IPC分类号: G06F11/30 G06F11/32 G06F11/07

    摘要: 本公开提供了一种整机柜硬件监控方法及装置,其中,该方法包括:在第一周期采集第一监控数据;将所述第一监控数据中的第一时序数据保存至第一存储位置,以实现第一时序数据的持久化保存,将所述第一监控数据中的其他数据保存至第二存储位置;其中,所述其他数据为所述第一监控数据中除所述第一时序数据之外的数据;判断所述第一监控数据中是否存在异常监控数据;若存在,则根据所述异常监控数据生成告警信息,以提示与所述异常监控数据对应的硬件设备处于异常状态;调整与所述异常监控数据对应的硬件设备,以解除所述硬件设备的异常状态。该实施方式能够提高整机柜硬件监控的效率,进而提高整机柜的稳定性和可靠性。

    集群性能评估方法、装置、设备及介质

    公开(公告)号:CN117667632A

    公开(公告)日:2024-03-08

    申请号:CN202311686284.X

    申请日:2023-12-08

    IPC分类号: G06F11/34 G06F11/30

    摘要: 本公开提供了一种集群性能评估方法、装置、设备、介质及程序产品,可以应用于计算机技术领域和大数据技术领域。该集群性能评估方法,包括:获取与目标集群有关的M个局部性能指标各自的第一理想值;根据M个第一理想值,计算得到目标集群的综合性能指标的第二理想值;获取目标集群在处理目标业务过程中,M个局部性能指标各自的第一实际值,其中,第一实际值是在目标集群处理目标业务的过程中采集得到的;根据M个第一实际值,计算得到目标集群的综合性能指标的第二实际值;以及根据第二理想值和第二实际值,生成目标集群的优化策略。本公开还提供了一种集群性能评估装置、设备、存储介质和程序产品。

    服务器节能方法、装置、设备及存储介质

    公开(公告)号:CN117762237A

    公开(公告)日:2024-03-26

    申请号:CN202311773850.0

    申请日:2023-12-21

    摘要: 本公开提供了一种服务器节能方法、装置、设备及存储介质,涉及服务器节能技术领域。所述方法包括实时监测CPU使用参数;获取CPU的性能指标;若CPU的性能指标未在预设范围内,则根据预先训练的算法模型对CPU使用参数、CPU的性能指标进行处理,得到Uncore流量阈值和第一频率;根据Uncore流量阈值和第一频率对CPU进行配置,以使CPU的性能指标处于预设范围内。本公开能够在不降低Core频率的情况下,既保证处理器的CPU性能,又能实现降低CPU工号的目的,从而降低整机功耗,达到节能目的。

    模型的训练方法、筛选标准输出方法、筛选方法及装置

    公开(公告)号:CN116089064A

    公开(公告)日:2023-05-09

    申请号:CN202211575811.5

    申请日:2022-12-08

    IPC分类号: G06F9/50 G06F11/30 G06F11/32

    摘要: 本公开提供了一种模型的训练方法、筛选标准输出方法、筛选方法及装置。涉及物联网、人工智能等技术领域。模型的训练方法包括:获取目标硬盘的目标硬盘属性信息,其中,目标硬盘满足目标筛选阈值,目标筛选阈值包括针对目标硬盘的至少一个硬盘属性信息定义的阈值;获取第一业务针对目标硬盘定义的第一硬盘属性期望值,其中,第一业务具有第一业务类型信息;将目标硬盘属性信息、第一业务类型信息和第一硬盘属性期望值输入待训练的预测模型,得到预测筛选阈值,其中,预测筛选阈值用于在将目标硬盘应用于第一业务的情况下被调用;以及利用目标筛选阈值和预测筛选阈值训练预测模型。

    监控数据的方法、装置、设备和计算机可读介质

    公开(公告)号:CN118295892A

    公开(公告)日:2024-07-05

    申请号:CN202410525933.6

    申请日:2024-04-28

    摘要: 本发明公开了监控数据的方法、装置、设备和计算机可读介质,涉及计算机技术领域。该方法的一具体实施方式包括:采集器按照数据监控周期,获取并以预设数据格式推送所述硬件设备的规格参数和所述硬件设备的当前运行状态数据,至负载均衡后的网关中;所述负载均衡后的网关,将所述硬件设备的规格参数和所述硬件设备的当前运行状态数据通过配置的实例存储至消息队列中;识别端根据从所述消息队列中获取的所述硬件设备的规格参数筛选出所述硬件设备的故障认定字段,以结合所述硬件设备的当前运行状态识别出硬件故障,并发送所述硬件故障的告警。该实施方式能够实现集中化大规模的服务器监控。

    一种组件故障检测的方法和装置
    6.
    发明公开

    公开(公告)号:CN115827294A

    公开(公告)日:2023-03-21

    申请号:CN202211425603.7

    申请日:2022-11-15

    IPC分类号: G06F11/07 G06F18/214

    摘要: 本发明公开了一种组件故障检测的方法和装置,涉及计算机、云计算、大数据等技术领域。该方法的一具体实施方式包括:多个依次执行的故障检测节点,将第一个故障检测节点作为第一节点,第一节点根据第一故障检测数据进行第一故障检测,得到第一检测结果;对于故障检测节点中非第一节点的每个第二节点,依次根据该第二节点的前一节点的检测结果对前一节点的故障检测数据进行打标生成第二故障检测数据,根据第二故障检测数据进行第二故障检测,得到该第二节点的第二检测结果;将最后一个第二节点的第二检测结果作为组件故障检测结果。该实施方式能够通过多节点链式计算的方式,提高了系统组件故障检测的准确率,减小了检测结果的误报率。

    硬盘故障预测方法及装置
    7.
    发明公开

    公开(公告)号:CN114661566A

    公开(公告)日:2022-06-24

    申请号:CN202210167529.7

    申请日:2022-02-23

    摘要: 本公开提供一种硬盘故障预测方法及装置,包括:获取与硬盘状态关联的实时日志数据;将实时日志数据输入至故障预测模型,获取硬盘故障预测结果;其中,故障预测模型基于故障硬盘负样本和正常硬盘正样本训练获得;故障硬盘负样本的采样时间区间为比故障上报时间点早一个预定采样周期的时间点至故障上报时间点之间的时间段。采用在故障上报点之前的一段时间的日志数据训练故障预测模型,使故障预测模型在训练时能够学习硬盘发生故障之前的特征,有利于故障预测模型在预测时,使故障预测模型能够对硬盘故障进行更加准确和及时的预测,为硬盘的修复或更换留出时间,保证基于硬盘的业务的正常运行。