基于性能数据时空特性的分析装置

    公开(公告)号:CN112540899B

    公开(公告)日:2022-10-04

    申请号:CN201910892364.8

    申请日:2019-09-20

    IPC分类号: G06F11/34

    摘要: 本发明公开了一种基于性能数据时空特性的分析装置,包括代码采集装置、性能采集装置、处理装置和显示装置,所述代码采集装置用于统计比重大于1%的代码空间、相同或具有90%以上重叠的代码空间、相同代码空间出现的时间节点和时间间隔以及同一代码空间与不同代码空间相邻出现的代码模式;所述性能采集装置根据代码采集装置的采集信息采集对应的性能事件;所述处理装置对采集信息进行处理,并筛选出性能事情的优缺点;所述显示装置根据处理装置输入的筛选信息,在显示屏上输出并行程序的缺陷的和优化方向。本发明能够快速定位程序的性能瓶颈,并为用户提供优化方向,分析效率高、优化速度快。

    众核异构架构下的多类型目标代码的透明加载方法

    公开(公告)号:CN112631662B

    公开(公告)日:2022-07-12

    申请号:CN201910904063.2

    申请日:2019-09-24

    IPC分类号: G06F9/4401

    摘要: 本发明公开一种众核异构架构下的多类型目标代码的透明加载方法,用户执行execve系统调用进入内核打开目标代码文件,读入目标文件头部,寻找标代码格式的处理函数;检查目标代码ELF头部信息正确性和Machine字段信息;解析环境变量;填写程序参数、环境变量必要信息到用户栈;加载目标代码的程序头表;根据数据段表信息,将程序段、数据段拷贝到物理空间中;初始化,对该数据结构中的元素进行赋值;根据配置信息,配置运算核中的配置寄存器;启动运算核心;检查程序类型;加载操作系统中驻留服务程序,修改程序的执行入口为服务程序的入口;进入新的程序入口执行。本发明实现了一套“异构”程序的加载流程,统一了“异构”程序执行流程,提升了用户的好用性。

    基于异构CPU的虚拟机迁移方法

    公开(公告)号:CN112540824B

    公开(公告)日:2022-07-12

    申请号:CN201910891125.0

    申请日:2019-09-20

    IPC分类号: G06F9/455

    摘要: 本发明公开了种基于异构CPU的虚拟机迁移方法,所述异构CPU进一步包括:管控核、计算核、虚拟机操作系统、宿主机操作系统和虚拟机管理模块;包括以下步骤:虚拟机迁移开始,虚拟机的管控核向计算核发送暂停命令,当计算核暂停成功时,计算核的状态维持不变;虚拟机操作系统将计算核的状态存入指定的内存中,所述计算核的状态为寄存器状态、存储器状态和系统调用状态;虚拟机管理模块发出虚拟机暂停命令,虚拟机暂停成功后,虚拟机状态维持不变。本发明虚拟机迁移方法在支持通用虚拟机迁移技术相关接口的基础上,解决了异构架构虚拟机的计算核上进程的迁移问题。

    基于定制TLB代换的虚拟机迁移时脏页记录方法

    公开(公告)号:CN112559393B

    公开(公告)日:2022-10-04

    申请号:CN201910910090.0

    申请日:2019-09-25

    IPC分类号: G06F12/1027 G06F9/455

    摘要: 本发明公开一种基于定制TLB代换的虚拟机迁移时脏页记录方法,包括以下步骤:将虚拟机的迁移标志设置为开启,在虚拟机管理层申请“脏页缓冲区”;判断造成缺页的读写标志,如果是读标志,则需要设置TLB的只读标志位;如果是写标志,计算虚拟地址对应的宿主机页面号,并记录脏页;在数据流异常处理流程中,重填TLB,判断此时TLB是否真正具有只读标志,如果没有则需要记录脏页;否则,进入正常的数据流异常处理流程中。本发明通过虚拟地址到宿主机页面的映射关系,在特权指令模式下实现脏页记录过程,无需维护额外的影子页表,节约大量的内存资源;无需频繁虚拟机退出操作,节约大量的CPU资源,并且大幅度提高了TLB的命中率,进而提高CPU执行效率。

    浮点SIMD上下文切换的性能优化方法

    公开(公告)号:CN112395005B

    公开(公告)日:2022-07-12

    申请号:CN201910764140.9

    申请日:2019-08-19

    IPC分类号: G06F9/30 G06F9/38

    摘要: 本发明公开了一种浮点SIMD上下文切换的性能优化方法,包括以下步骤:在进程描述符结构中增加一CPU标识字段,创建一个全局的数组;进程切换时将被选中进程的浮点SIMD状态最近被装载的CPU号与所述目标CPU号进行匹配,同时将目标CPU最近装载浮点SIMD寄存器的所述进程号与被选中进程号进行匹配,若二者均相等,目标CPU不对进程的浮点SIMD状态进行恢复,此时清除进程的进程标志位FOREIGN_FPSTATE标志,若否,目标CPU对该进程的浮点SIMD状态进行恢复,此时设置进程的进程标志位FOREIGN_FPSTATE标志。本发明减小了内核进程切换开销,对内核改动较小,且适用其他系统寄存器的保留和恢复过程,如性能计数器等。

    基于BMC的海量节点固件版本管理及网络加载方法

    公开(公告)号:CN112558999A

    公开(公告)日:2021-03-26

    申请号:CN201910910088.3

    申请日:2019-09-25

    IPC分类号: G06F8/65 G06F8/71 G06F9/4401

    摘要: 本发明公开一种基于BMC的海量节点固件版本管理及网络加载方法,从对应的外围节点读取此节点配置,如果配置为BMC启动,则从对应BMC节点加载固件,否则从外围节点加载固件;通过外围节点作为代理,将所有最新版本的固件更新到相应的BMC节点;并行检查外围节点中的固件版本;每个外围节点向负责的BMC节点发布查询命令,并收集BMC节点的返回结果。本发明实现了基于BMC的网络加载技术,可以避免海量节点启动时的网络阻塞,极大降低海量节点开机时间;降低了发布固件的时间;避免了并行发布和管理固件版本的线程爆炸。

    一种超级计算机与量子计算机协同的软件栈及工作方法

    公开(公告)号:CN115271078A

    公开(公告)日:2022-11-01

    申请号:CN202210933684.5

    申请日:2022-08-04

    IPC分类号: G06N10/20 G06N10/80

    摘要: 一种超级计算机与量子计算机协同的软件栈及工作方法,属于量子计算技术领域。本发明的软件栈包括:经典与量子协同编程框架:在经典编程模型框架中新增量子语言要素的扩展;异构融合编译环境:能够通过要素分析识别出经典与量子混合应用程序中的经典程序部分和量子程序部分;经典与量子协同操作系统:将硬件资源进行了抽象并提供相应的驱动程序;量子指令集:对量子计算机硬件系统进行控制的指令集,与量子物理体系进行耦合。本发明将超级计算机软件模型与量子计算机软件模型融合,即能够保证传统超级计算机正常运行,又能发挥量子加速计算的性能优势,推进量子计算机更广泛应用。

    基于BMC的海量节点固件版本管理及网络加载方法

    公开(公告)号:CN112558999B

    公开(公告)日:2022-10-04

    申请号:CN201910910088.3

    申请日:2019-09-25

    IPC分类号: G06F8/65 G06F8/71 G06F9/4401

    摘要: 本发明公开一种基于BMC的海量节点固件版本管理及网络加载方法,从对应的外围节点读取此节点配置,如果配置为BMC启动,则从对应BMC节点加载固件,否则从外围节点加载固件;通过外围节点作为代理,将所有最新版本的固件更新到相应的BMC节点;并行检查外围节点中的固件版本;每个外围节点向负责的BMC节点发布查询命令,并收集BMC节点的返回结果。本发明实现了基于BMC的网络加载技术,可以避免海量节点启动时的网络阻塞,极大降低海量节点开机时间;降低了发布固件的时间;避免了并行发布和管理固件版本的线程爆炸。

    通用寄存器保留恢复的实现方法

    公开(公告)号:CN112540871B

    公开(公告)日:2022-10-04

    申请号:CN201910891118.0

    申请日:2019-09-20

    IPC分类号: G06F11/14 G06F9/30 G06F9/54

    摘要: 本发明公开一种通用寄存器保留恢复的实现方法,进程保留方法:用户进程调用系统调用ioctl函数;在ioctl函数中设置进程flag保留/恢复标志位;内核态切换到用户态,根据linux信号处理机制进入到对保留/恢复标志位判断;如果存在保留/恢复标志位,进入do_work_pending处理函数;do_work_pending处理函数将内核栈上的通用寄存器$0~$29全部保存到文件或指定内存中;进程恢复方法:其前三步骤与进程保留方法步骤相同,内核态切换到用户态,根据linux信号处理机制会进入到对保留/恢复标志位判断。本发明解决了通用寄存器保留不完整的问题。

    国产众核处理器计算核内存压缩方法

    公开(公告)号:CN112559242B

    公开(公告)日:2022-07-12

    申请号:CN201910910081.1

    申请日:2019-09-25

    摘要: 本发明公开一种国产众核处理器计算核内存压缩方法,包括以下步骤:进行进程保留时,操作系统进程保留接口先调用内核级的压缩接口对进程当前使用的内存映像进行压缩,再将压缩后的内存映像数据写入检查点文件中;在进程恢复时,操作系统进程恢复接口先调用内核级的解压缩接口对检查点文件中读出的内存映像数据进行解压缩,再将解压缩后的内存映像数据恢复到进程的内存空间中。本发明解决了当前国产超级计算机中进程保留恢复耗时长,用户体验较差的问题。