-
公开(公告)号:CN115269195B
公开(公告)日:2024-08-30
申请号:CN202210933675.6
申请日:2022-08-04
申请人: 无锡江南计算技术研究所
IPC分类号: G06F9/50 , G06F9/4401 , G06N10/20 , G06N10/40
摘要: 一种基于操作系统内核的量子计算资源管理方法,属于量子计算技术领域。本发明包括如下步骤:步骤1,解析当前量子计算任务所需的量子计算资源;步骤2,根据量子计算资源和当前系统中可用计算资源,给当前量子任务分配并映射相应的量子比特;步骤3,检测量子计算资源中量子比特的状态,若量子比特状态不满足计算需求,则对量子比特实施校准;步骤4,根据当前量子任务中所包含的量子逻辑门操作生成对应的控制脉冲波形文件;步骤5,根据控制脉冲波形文件,控制量子计算资源执行量子计算;步骤6,测量本次量子计算任务的计算结果。本发明对用户屏蔽了复杂的量子特性,为上层软件提供稳定的量子态描述,方便用户使用和控制量子设备。
-
公开(公告)号:CN112559952B
公开(公告)日:2023-07-07
申请号:CN201910918627.8
申请日:2019-09-26
申请人: 无锡江南计算技术研究所
IPC分类号: G06F17/14
摘要: 本发明公开一种基于序列分层的异构众核快速傅里叶变换方法,包括以下步骤:S1、将待转序列按FFT运算层序进行分块,分块大小为当前运算层一次基本运算的子序列大小,即第1次分块时,每个分块的大小为2,即将输入序列分成大小为2的若干个小块;第2次分块时,每个分块的大小为4,即将输入序列分成大小为4的若干个小块;以此类推,第n次分块时,每个分块的大小为2n,即将输入序列分成大小为2n的若干个小块;一直分到每个分块的大小与输入序列的长度相同为止;S2、将每一层的分块并行地利用异构众核架构进行加速运算,通过片上网络实现分块内部的众核加速。本发明提高大规模数据的FFT算法性能。
-
公开(公告)号:CN115269195A
公开(公告)日:2022-11-01
申请号:CN202210933675.6
申请日:2022-08-04
申请人: 无锡江南计算技术研究所
IPC分类号: G06F9/50 , G06F9/4401 , G06N10/20 , G06N10/40
摘要: 一种基于操作系统内核的量子计算资源管理方法,属于量子计算技术领域。本发明包括如下步骤:步骤1,解析当前量子计算任务所需的量子计算资源;步骤2,根据量子计算资源和当前系统中可用计算资源,给当前量子任务分配并映射相应的量子比特;步骤3,检测量子计算资源中量子比特的状态,若量子比特状态不满足计算需求,则对量子比特实施校准;步骤4,根据当前量子任务中所包含的量子逻辑门操作生成对应的控制脉冲波形文件;步骤5,根据控制脉冲波形文件,控制量子计算资源执行量子计算;步骤6,测量本次量子计算任务的计算结果。本发明对用户屏蔽了复杂的量子特性,为上层软件提供稳定的量子态描述,方便用户使用和控制量子设备。
-
公开(公告)号:CN114244857A
公开(公告)日:2022-03-25
申请号:CN202110387038.9
申请日:2021-04-12
申请人: 无锡江南计算技术研究所
IPC分类号: H04L67/1097 , G06F15/173
摘要: 本发明公开一种分布式存储系统的内存池管理方法,包括以下步骤:S1、分布式存储系统初始化开始,打开网卡设备;S2、分配内存,注册分布式存储系统内存池,记录内存池的首地址和内存大小;S3、将分布式存储系统内存池的首地址作为输入参数,注册网卡内存池,并将网卡内存池按分布式存储系统数据块大小组织并记录偏移,返回网卡句柄号;S4、分布式存储系统初始化结束。本发明可以在读写数据场景下分别消除分布式存储内存池到网卡内存池和网卡内存池到分布式存储内存池的内存拷贝,进一步降低上下文切换等开销,提升分布式存储系统的数据传输性能。
-
公开(公告)号:CN112560356A
公开(公告)日:2021-03-26
申请号:CN201910919675.9
申请日:2019-09-26
申请人: 无锡江南计算技术研究所
IPC分类号: G06F30/28 , G06F113/08 , G06F119/14
摘要: 本发明公开了种面向众核架构的稀疏矩阵向量乘众核优化方法,包括以下步骤:S1、已知:行数为m,列数为n的稀疏矩阵A,长为n的向量x;求解长度为m的向量y,y=Ax为稀疏矩阵A与向量x的点积;S1、定义x向量块大小blk_x_size,根据x向量元素下标对x向量元素进行分块将x向量进行分块;S2、根据x向量的分块信息,即S1中求解得到的x向量元素所在的x向量块编号信息,统计原始稀疏矩阵即稀疏矩阵A中每一行非零元所在列号对应的x向量块的编号,由此统计出稀疏矩阵向量乘时稀疏矩阵每一行所需要的x向量块的编号信息。本发明提高了整体众核加速性能,提高数据访问的局部性,对非结构网格CFD应用的优化作用明显。
-
公开(公告)号:CN112433829A
公开(公告)日:2021-03-02
申请号:CN201910788892.9
申请日:2019-08-26
申请人: 无锡江南计算技术研究所
摘要: 本发明公开一种以用户为核心的高性能计算机资源管理方法,基于以下模块:用户队列模块,包含所有使用高性能计算机系统的用户,每个用户可以使用1~2个有限队列资源;计算队列模块,可包含高性能计算机系统中所有的计算节点,且每个计算节点只能加入到一个计算队列;计算节点队列模块,将计算节点按照该节点的网络地址进行编号;资源管理系统,当用户队列模块中的用户向计算队列模块中的计算队列提交作业时,用于判断该用户下面是否包含有该队列。本发明解决了大型超算中心计算资源管理低效问题,提高高性能计算机系统计算资源的管理和服务能力。
-
-
-
公开(公告)号:CN102929723B
公开(公告)日:2015-07-08
申请号:CN201210441326.9
申请日:2012-11-06
申请人: 无锡江南计算技术研究所
IPC分类号: G06F9/50
摘要: 本发明提供了一种基于异构众核处理器的并行程序段划分方法,包括:对应用课题的数据进行数据相关性分析,以确定是否存在无数据相关性的程序基本段;若存在所述无数据相关性的程序基本段,则计算各无数据相关性的程序基本段的计算量;根据所述计算量,对所述无数据相关性的程序基本段进行第一级众核划分。本发明能解决一般科学计算与工程类应用在多态异构计算机系统上的适应性问题,同时提高众核级的并行效率和负载平衡效果。
-
公开(公告)号:CN114218141B
公开(公告)日:2024-02-02
申请号:CN202110479722.X
申请日:2021-04-30
申请人: 无锡江南计算技术研究所
IPC分类号: G06F13/28
摘要: 本发明公开一种针对深度学习半精度算子数据访存对界处理方法,针对深度学习中算子的计算特点和张量空间分布,对多维张量的特定维度做4B对界处理,将四维张量的输入数据按照实际参与计算的维度分为不同的类,分别使用不同的半精度数据对界处理方法;具体为,根据输入的算子类型和输入数据的计算维度,选择不同的对界方法。本发明解决了异构众核平台上半精度算子DMA访存的不对界问题,且不仅能降低内存空间的占用,还能有效减少对界处理的时间,提升对界处理的性能。
-
-
-
-
-
-
-
-
-