一种面向HPC计算任务的作业安全运行预警系统及方法

    公开(公告)号:CN116055290A

    公开(公告)日:2023-05-02

    申请号:CN202211728383.5

    申请日:2022-12-30

    Abstract: 本发明公开了一种面向HPC计算任务的作业安全运行预警系统及方法,该系统包括多个客户端、服务端和预警端;多个客户端分别部署在HPC计算任务中的各运行节点处,用于采集各节点的实时节点运行信息;服务端部署在第一服务器中,用于对采集的实时节点运行信息进行数据处理并将其封装为预警系统可识别的数据格式;预警端部署在第二服务器中,用于识别处理后的节点数据,根据预设的预警规则和作业预警模型进行数据分析,分析各节点状态和作业运行状态,获取分析结果,根据分析结果对当前作业进行标记,对可能出现异常的作业进行预警。本发明通过上述系统对异常情况进行提前识别与定位,实现作业安全运行的提前预警,保障HPC计算任务的准确性。

    一种基于神威架构的迭代求解器优化方法及系统

    公开(公告)号:CN120012426A

    公开(公告)日:2025-05-16

    申请号:CN202510119252.4

    申请日:2025-01-24

    Abstract: 本发明提出了一种基于神威架构的迭代求解器优化方法与系统,涉及电子信息技术领域,针对的问题是:目前神威新一代超级计算机中适用于SW26010Pro架构的AztecOO仍然采用双精度算法,存储和计算成本大,AztecOO求解器计算效率低、计算精度低。该方法获取稀疏线性方程组的求解任务,并将所述求解任务下发至主核;主核划分求解任务,并为其分配内存;主核调用从核启动函数,并执行计算;从核将计算结果反馈给主核,得到稀疏线性方程组的解。本发明通过设计的精度选择策略、矩阵分割算和混合精度算法,优化迭代求解器,在保证足够计算精度的情况下,提高算法计算速度,节约内存资源,以加速求解器整个求解过程,为数值计算方面的研究人员提供更高效的开发效率。

    基于微架构参数的处理器性能模型构建方法及系统

    公开(公告)号:CN118227442A

    公开(公告)日:2024-06-21

    申请号:CN202410442884.X

    申请日:2024-04-12

    Abstract: 本发明公开一种基于微架构参数的处理器性能模型构建方法及系统,涉及处理器性能建模技术领域,方法为:获取处理器运行作业时的微架构参数;将微架构参数中的作业运行时间作为因变量、硬件微观结构参数作为自变量、本地计算特征参数作为辅助变量,初步构建基于线性部分和非线性部分的性能模型;以自变量和辅助变量之间的相关性为权重改进线性部分,结合梯度下降法优化改进的线性部分;动态设定自变量的组合和幂次范围,并引入自变量的对数项,利用多项式特征转换,结合ElasticNetCV模型和粒子群优化算法,优化非线性部分;以此搭建最终的性能模型。本发明能够更好的量化作业运行性能,应对复杂的数据情况,精确预测作业运行时间。

Patent Agency Ranking