一种Linux操作系统硬件错误识别方法及系统

    公开(公告)号:CN118295864B

    公开(公告)日:2024-08-13

    申请号:CN202410718889.0

    申请日:2024-06-05

    IPC分类号: G06F11/22 G06F18/214

    摘要: 本发明公开一种Linux操作系统硬件错误识别方法及系统,涉及操作系统技术领域。为了高效的识别服务器的硬件错误,采用方案包括:获取硬件错误日志信息,存储到数据集;对数据集的硬件错误日志信息进行格式化和标准化处理,得到TXTLINE格式的数据集;手动或自动标记数据集中硬件错误日志的关键信息,基于标记信息定义正则表达式和训练NER模型;实时采集硬件错误日志信息,利用正则表达式自动识别日志信息中的错误格式,利用NER模型自动识别日志信息中错误格式的具体错误类型。本发明可以实现对硬件错误的快速识别和标记,便于运维人员快速解决硬件故障,提高服务器的稳定性和可靠性,减少因硬件故障导致的经济损失和维护成本。

    快速检测操作系统内存不可恢复错误的系统及方法

    公开(公告)号:CN118245290B

    公开(公告)日:2024-08-13

    申请号:CN202410649705.X

    申请日:2024-05-24

    IPC分类号: G06F11/14 G06F11/07

    摘要: 本发明公开了快速检测操作系统内存不可恢复错误的系统及方法,属于操作系统技术领域,要解决的技术问题为在不影响其他正常运行进程的前提下、如何快速检测操作系统内存的不可恢复错误。包括内存UCE容错功能快速检测命令模块、内存错误事件接收模块、内存错误事件处理模块以及内存错误日志监测模块;内存UCE容错功能快速检测命令模块通过内存模拟注入模块向内存注入各种场景下模拟内存UCE错误事件;内存错误日志监测模块通过观测和跟踪模块得到内存错误相关信息;内存错误事件接收模块用于获取硬件错误事件信息;内存错误事件处理模块基于预定义的内存错误处理规则、通过操作系统内的内存错误处理模块进行内存错误的修复处理。

    一种Linux操作系统硬件错误识别方法及系统

    公开(公告)号:CN118295864A

    公开(公告)日:2024-07-05

    申请号:CN202410718889.0

    申请日:2024-06-05

    IPC分类号: G06F11/22 G06F18/214

    摘要: 本发明公开一种Linux操作系统硬件错误识别方法及系统,涉及操作系统技术领域。为了高效的识别服务器的硬件错误,采用方案包括:获取硬件错误日志信息,存储到数据集;对数据集的硬件错误日志信息进行格式化和标准化处理,得到TXTLINE格式的数据集;手动或自动标记数据集中硬件错误日志的关键信息,基于标记信息定义正则表达式和训练NER模型;实时采集硬件错误日志信息,利用正则表达式自动识别日志信息中的错误格式,利用NER模型自动识别日志信息中错误格式的具体错误类型。本发明可以实现对硬件错误的快速识别和标记,便于运维人员快速解决硬件故障,提高服务器的稳定性和可靠性,减少因硬件故障导致的经济损失和维护成本。

    快速检测操作系统内存不可恢复错误的系统及方法

    公开(公告)号:CN118245290A

    公开(公告)日:2024-06-25

    申请号:CN202410649705.X

    申请日:2024-05-24

    IPC分类号: G06F11/14 G06F11/07

    摘要: 本发明公开了快速检测操作系统内存不可恢复错误的系统及方法,属于操作系统技术领域,要解决的技术问题为在不影响其他正常运行进程的前提下、如何快速检测操作系统内存的不可恢复错误。包括内存UCE容错功能快速检测命令模块、内存错误事件接收模块、内存错误事件处理模块以及内存错误日志监测模块;内存UCE容错功能快速检测命令模块通过内存模拟注入模块向内存注入各种场景下模拟内存UCE错误事件;内存错误日志监测模块通过观测和跟踪模块得到内存错误相关信息;内存错误事件接收模块用于获取硬件错误事件信息;内存错误事件处理模块基于预定义的内存错误处理规则、通过操作系统内的内存错误处理模块进行内存错误的修复处理。