一种基于IPMI的冗余计算机系统节点故障主被动检测方法

    公开(公告)号:CN103617104B

    公开(公告)日:2017-01-04

    申请号:CN201310634139.7

    申请日:2013-12-01

    IPC分类号: G06F11/22 G06F11/07

    摘要: 本发明公开了一种冗余计算机系统的故障主被动检测方法。该方法包括第一步:利用冗余待测计算机的IPMI标准接口,故障检测模块实时收集冗余系统中待测的主用计算机和备用计算机的状态数据,收集到一定数量的运行状态数据后;第二步:故障检测模块通过模式匹配方法诊断待测计算机是否出现运行故障;第三步:依据给定的系统参数值,预测主用计算机一段时间内出现故障事件的概率。作为实现多台计算机冗余系统容错不可或缺的基础组件之一,本发明故障主被动检测方法能够在一定程度上降低故障检测的时间延迟、提高故障检测的准确性、预测故障发生概率,以支撑关键服务系统的快速失效切换和主动容错等高可用保障机制。

    一种集群成员节点可用性监测设备及方法

    公开(公告)号:CN112486776A

    公开(公告)日:2021-03-12

    申请号:CN202011413839.X

    申请日:2020-12-07

    IPC分类号: G06F11/30 G06F11/32

    摘要: 本发明公开了一种集群成员节点可用性监测设备及方法,设备包括:节点状态监测模块,用于监测与网络互联设备相连的集群信息系统内部主机节点的状态,实现节点状态监测,并通过网络互联设备传送给监测管理模块;故障比对模块,用于判定主机节点是否出现故障事件,并将故障事件传送给监测管理模块;监测管理模块,用于对其所连接的节点状态监测模块获取到的主机节点状态数据进行数据汇聚,并进行保存记录;还用于将故障事件发送给状态信息通知模块;状态信息通知模块,用于实现故障事件的提示或输出。本发明能提高集群信息系统节点状态监控准确率、监控粒度、监控实时性,克服传统人工操作模式存在的粒度粗、实时性差、能力单一、扩展性差等不足。

    一种面向k8s的用户态虚拟设备驱动框架

    公开(公告)号:CN112486632A

    公开(公告)日:2021-03-12

    申请号:CN202011413906.8

    申请日:2020-12-07

    IPC分类号: G06F9/455

    摘要: 本发明公开了一种面向k8s的用户态虚拟设备驱动框架,该框架采用SRIOV技术,将IO设备虚拟成多个共享硬件资源的虚拟设备,并将虚拟设备的IO地址、中断映射到pod的pause容器中,在pause容器运行虚拟设备的驱动程序。pod中的其他应用容器通过共享内存的方式访问pause容器中的驱动程序。该框架提供了虚拟设备管理、应用程序与驱动程序通信接口等内容,用户只需在框架下编写具体设备的驱动代码,降低了编写设备驱动程序的复杂性。该框架采用虚拟化和透传的方式,将设备驱动的大部分功能移植到pause容器内实现,可与应用程序一起交付,在保证设备效率的同时,提升了驱动程序的隔离性、可交付性和系统的可靠性。

    一种远程输入输出设备中断映射装置与方法

    公开(公告)号:CN113986457A

    公开(公告)日:2022-01-28

    申请号:CN202111206632.X

    申请日:2021-10-17

    IPC分类号: G06F9/455 G06F13/42

    摘要: 本发明涉及一种远程输入输出设备中断映射装置与方法,所述装置包括设备共用适配模块、设备驱动模块、远程设备中断映射模块、设备共用传输线缆、设备共用交换模块;所述方法包括:通过PCIE插槽,安装设备共用适配模块;利用设备共用传输线缆将各主机节点上的设备共用适配模块连接;借用侧主机节点的远程设备中断映射模块根据借用关系监听虚拟设备的中断请求;远程设备中断映射模块截获中断请求,重定向到远程物理设备;远程物理设备根据调用中断请求完成处理操作后,回复消息到发起中断的主机节点应用。本发明支持远程输入输出设备与主机节点之间的中断映射转化;支持通用的NVME、GPU、NPU和网卡等PCIE设备。

    一种基于多核处理器和FPGA的软硬件混合实时任务调度方法

    公开(公告)号:CN103488531B

    公开(公告)日:2016-08-17

    申请号:CN201310460364.3

    申请日:2013-09-26

    IPC分类号: G06F9/46 G06F9/50

    摘要: 本发明公开了一种基于多核处理器和FPGA异构平台的软/硬件混合实时任务调度方法,该方法把实时任务的软件部分和硬件部分划分为强实时任务和弱实时任务,软件部分必须在截止期限内完成,给出尚可接受的计算结果,而硬件部分对软件部分的计算结果进一步优化,给出更加令人满意的计算结果。该调度方法包含如下步骤:(1)根据处理器核心数m,把实时任务分成m组;(2)判定每组实时任务的可调度性;(3)动态设置实时任务软件部分的优先级;(4)调度实时任务软件部分;(5)调度实时任务硬件部分。本发明将实时任务分为强实时和弱实时两部分,该方法不仅能使实时任务满足时间限制条件,而且还能提供更加满意的计算结果。

    一种CPS节点故障检测装置与方法

    公开(公告)号:CN109347703A

    公开(公告)日:2019-02-15

    申请号:CN201811388484.6

    申请日:2018-11-21

    IPC分类号: H04L12/26 H04L12/24

    摘要: 本发明涉及一种CPS节点故障检测装置与方法,装置包括状态采集模块、检测信息汇聚模块、检测信息展示模块;状态采集模块对所连接的CPS应用系统进行节点状态监测,并通过网络互联设备传送给检测信息汇聚模块;检测信息汇聚模块对从状态采集模块获取的监控数据进行记录存储,通过对监控数据进行分析,当CPS应用系统某CPS节点出现故障异常事件时,通过检测信息汇聚模块将分析得到CPS节点故障异常事件传送检测信息展示模块,检测信息展示模块通过显示终端实现故障异常展示。本发明能够提高CPS应用系统节点状态监控准确率、监控粒度、监控实时性。

    一种基于IPMI的冗余计算机系统节点故障主被动检测方法

    公开(公告)号:CN103617104A

    公开(公告)日:2014-03-05

    申请号:CN201310634139.7

    申请日:2013-12-01

    IPC分类号: G06F11/22 G06F11/07

    摘要: 本发明公开了一种冗余计算机系统的故障主被动检测方法。该方法包括第一步:利用冗余待测计算机的IPMI标准接口,故障检测模块实时收集冗余系统中待测的主用计算机和备用计算机的状态数据,收集到一定数量的运行状态数据后;第二步:故障检测模块通过模式匹配方法诊断待测计算机是否出现运行故障;第三步:依据给定的系统参数值,预测主用计算机一段时间内出现故障事件的概率。作为实现多台计算机冗余系统容错不可或缺的基础组件之一,本发明故障主被动检测方法能够在一定程度上降低故障检测的时间延迟、提高故障检测的准确性、预测故障发生概率,以支撑关键服务系统的快速失效切换和主动容错等高可用保障机制。