-
公开(公告)号:CN118132144A
公开(公告)日:2024-06-04
申请号:CN202410320361.8
申请日:2024-03-20
IPC分类号: G06F9/22 , G06F9/445 , G06F18/20 , G06F18/27 , G06F18/2135 , G06F18/2415
摘要: 本发明公开了一种基于超算平台微架构的参数选择方法及系统,属于处理器技术领域。包括:提取超算平台运行时的硬件微观结构参数和本地计算特征参数,并进行预处理,获取第一参数集;对第一参数集进行向后逐步回归,基于预设的判断准则,通过协方差矩阵自适应演化优化特征选择过程,获取第二参数集;根据第二参数集中数据之间的相关性,设置相关性阈值;根据相关性阈值,对第二参数集进行二次分析,获取影响显著参数集。能够对超算平台作业运行时间有显著影响的参数进行有效提取,了解作业运行时存在的性能现象,并且能够及时发现出现异常的参数信息和推测导致性能异常的原因;解决现有超算平台运行难以监测评估的问题。
-
公开(公告)号:CN118227442A
公开(公告)日:2024-06-21
申请号:CN202410442884.X
申请日:2024-04-12
摘要: 本发明公开一种基于微架构参数的处理器性能模型构建方法及系统,涉及处理器性能建模技术领域,方法为:获取处理器运行作业时的微架构参数;将微架构参数中的作业运行时间作为因变量、硬件微观结构参数作为自变量、本地计算特征参数作为辅助变量,初步构建基于线性部分和非线性部分的性能模型;以自变量和辅助变量之间的相关性为权重改进线性部分,结合梯度下降法优化改进的线性部分;动态设定自变量的组合和幂次范围,并引入自变量的对数项,利用多项式特征转换,结合ElasticNetCV模型和粒子群优化算法,优化非线性部分;以此搭建最终的性能模型。本发明能够更好的量化作业运行性能,应对复杂的数据情况,精确预测作业运行时间。
-
公开(公告)号:CN117056756A
公开(公告)日:2023-11-14
申请号:CN202311088912.4
申请日:2023-08-28
申请人: 山东省计算中心(国家超级计算济南中心)
摘要: 本发明公开了基于运行数据分析的水冷列间空调制冷性能动态评判方法,方法步骤如下:S1:划分制冷设备端运行的负荷状态类别,并根据列间空调的RH值划分到对应的类别;S2:确定空调PR参数范围;S3:若空调的PR参数处于区间Ii,则判断为运行正常,否则执行S4;S4:基于电能功耗进行聚类分析;S5:根据列间空调的CV参数进一步排查;S6:计算评估滞后影响情况;S7:按时间间隔周期对每一台列间空调设备运行性能进行实时评估;S8:对S2中的PR参数进行更新。本发明能够及时发现运行性能离群或性能低下、具有性能恶化趋势或性能抖动剧烈的列间空调设备,为提高末端制冷系统性能提供了量化数据支撑。
-
公开(公告)号:CN113467976A
公开(公告)日:2021-10-01
申请号:CN202110854458.3
申请日:2021-07-28
申请人: 山东省计算中心(国家超级计算济南中心)
IPC分类号: G06F9/54
摘要: 本发明公开了一种自动优化的MPI通信传输方法。本发明所述自动优化MPI通信传输方法,根据通信数组的数据量、通信次数和前后代码段情况,选择最优通信数据量区间{min,max}下每个数据包的大小,利用MPI通信带宽、降低时延,提高程序通信执行效率,特别在大规模下能显著减少程序执行的时间开销,实现对不同通信数据量的MPI程序进行自动优化。
-
公开(公告)号:CN110262900A
公开(公告)日:2019-09-20
申请号:CN201910536896.8
申请日:2019-06-20
申请人: 山东省计算中心(国家超级计算济南中心)
摘要: 本发明涉及一种基于申威众核处理器的主核与核组之间通信锁同步运行加速方法,包括步骤如下:A、判断程序段A、程序段B、程序段C之间的程序上下文依赖关系;如果程序段A、程序段B、程序段C三者之间都存在程序上下文依赖关系,则顺序执行;否则,调整程序段A、程序段B、程序段C之间的执行顺序,进行执行;B、对连续的后三段程序段执行步骤A直至执行完所有的程序。本发明判断程序段之间的程序上下文依赖关系,分情况灵活处理,还引入了“通信锁”同步机制,节省了主核等待时间,实现了主核和核组的并行处理,程序执行过程中,减少了对spawn和join核组线程的需要次数,提高了程序的执行效率。
-
公开(公告)号:CN110222007A
公开(公告)日:2019-09-10
申请号:CN201910536855.9
申请日:2019-06-20
申请人: 山东省计算中心(国家超级计算济南中心)
摘要: 本发明涉及一种基于申威众核处理器的加速运行方法,包括:A、判断程序段A、程序段B、程序段C之间的程序上下文依赖关系;如果程序段A、程序段B、程序段C三者之间都存在程序上下文依赖关系,则顺序执行;否则,调整程序段A、程序段B、程序段C之间的执行顺序,进行执行;B、对连续的后三段程序段执行步骤A直至执行完所有的程序。本发明判断程序段以及程序子段之间的程序上下文依赖关系,分情况灵活处理,引入了通信锁同步机制,节省了主核等待时间,实现了主核和核组的并行处理,程序执行过程中,减少了对spawn和join核组线程的需要次数,提高了程序的执行效率。
-
公开(公告)号:CN108628727A
公开(公告)日:2018-10-09
申请号:CN201810353590.4
申请日:2018-04-19
申请人: 山东省计算中心(国家超级计算济南中心)
摘要: 本发明涉及一种基于模式运行时特征的模式作业运行状态分析方法,包括:(1)实时提取状态特征、量化特征;(2)根据状态特征判别模式作业运行状态;(3)根据量化特征分析模式作业性能是否发生异常。本发明基于定性信息的状态特征,通过对有限个状态的直接判断,可有效发现一定类别的故障,提高了故障发现的及时性。基于性能参数的量化特征,通过相关性分析、常态范围判别、固定周期预测、时间序列分析等技术,能够及时识别模式作业的运行异常,能够有效发现计算节点挂死、作业无输出、中间变量异常等目前存在的不便识别和判断的现象,有利于模式的业务连续性运行保障。
-
公开(公告)号:CN110262884A
公开(公告)日:2019-09-20
申请号:CN201910536853.X
申请日:2019-06-20
申请人: 山东省计算中心(国家超级计算济南中心)
摘要: 本发明涉及一种基于申威众核处理器的核组内多程序多数据流分区并行的运行方法,本发明根据不同程序段之间的依赖关系,将多个可并行优化程序段放入同一核组执行,在同一核组内部,可以选择同步或者异步执行多个程序段;根据同一程序段内不同程序子段之间的依赖关系,在同一核组内部,可以选择并行执行多个程序子段。此种方法可以减少核组spawn与join的次数,减少主核与核组之间DMA传输的次数,重复利用核组中的数据,从而提高程序的运行效率。
-
公开(公告)号:CN117076070A
公开(公告)日:2023-11-17
申请号:CN202311018731.4
申请日:2023-08-14
申请人: 山东省计算中心(国家超级计算济南中心)
IPC分类号: G06F9/48
摘要: 本发明公开了基于运行信息的高性能计算作业调度系统性能分析方法,方法步骤如下:S1:自建分析数据库;S2:初始运行时,所有用到的数组和变量赋值为0;S3:获取当前时刻记为now,其小时数h、分钟数m,从中获取历史分析数据,并判断h=0和m=0是否成立;S4:查询调度系统作业信息并根据State进行分类处理;S5:将计算结果累加并写入自建数据库;S6:对一段时间数据进行一维聚类;S7:计算期望值;S8:对Ft进行后分析比较,分析每一类规模中排队时间的差值Pd情况;S9:如果正常运行范围的预测的准确率保持不变或有提高则参数和Cnum保持不变;如果准确率有下降趋势,转到S7得到新的聚类Cnum;S10:持续分析调度和作业信息。本发明提高了运维维护管理效率。
-
公开(公告)号:CN113835984A
公开(公告)日:2021-12-24
申请号:CN202111135266.3
申请日:2021-09-27
申请人: 山东省计算中心(国家超级计算济南中心)
IPC分类号: G06F11/34
摘要: 本发明公开了一种基于国产超算微架构的众核应用性能评估方法。本发明针对神威国产超级计算机系统Athread并行编程模式中,线程组任务分发和结束、数据传输、数据计算、从核同步与通信等主要流程,根据大量不同规模的实际算例运行数据,拟合出对应的时间运行模型,且误差在10%以内,能有效的评估众核应用程序的运行性能。
-
-
-
-
-
-
-
-
-