-
公开(公告)号:CN113535528B
公开(公告)日:2023-08-08
申请号:CN202110728761.9
申请日:2021-06-29
申请人: 中国海洋大学
摘要: 本发明公开了面向分布式图迭代计算作业的日志管理系统、方法及介质,在分布式图迭代计算作业开始后,在故障发生后进行溯源,利用基于统一时间度量标准的日志增量变化分析溯源方法对故障溯源:持续监控各个节点的日志增量变化情况,以主控节点的时间为基准,判定各个节点日志停止更新的次序,进而给出候选的故障源节点;故障溯源后,程序进行调试中对日志分析进行优化,通过迁移并分布式执行检索命令,收集关键日志信息进行调试;其中,在分布式图迭代计算时,通过增量检索方法实时查看迭代步信息。通过本发明使用户在确定故障源头所在节点之后,能够快速跟踪分析程序运行细节,完成程序调试。
-
公开(公告)号:CN113535528A
公开(公告)日:2021-10-22
申请号:CN202110728761.9
申请日:2021-06-29
申请人: 中国海洋大学
摘要: 本发明公开了面向分布式图迭代计算作业的日志管理系统、方法及介质,在分布式图迭代计算作业开始后,在故障发生后进行溯源,利用基于统一时间度量标准的日志增量变化分析溯源方法对故障溯源:持续监控各个节点的日志增量变化情况,以主控节点的时间为基准,判定各个节点日志停止更新的次序,进而给出候选的故障源节点;故障溯源后,程序进行调试中对日志分析进行优化,通过迁移并分布式执行检索命令,收集关键日志信息进行调试;其中,在分布式图迭代计算时,通过增量检索方法实时查看迭代步信息。通过本发明使用户在确定故障源头所在节点之后,能够快速跟踪分析程序运行细节,完成程序调试。
-