-
公开(公告)号:CN114219083A
公开(公告)日:2022-03-22
申请号:CN202110452694.2
申请日:2021-04-26
申请人: 无锡江南计算技术研究所
摘要: 本发明公开一种基于ONNX面向Caffe2训练的深度学习模型自动转换方法,包括以下步骤:S1、ONNX文件向Caffe2文件的映射,得到Caffe2格式的前向传播网络,S2、根据S1中获得的前向传播网络的信息,自动生成求梯度算子,得到反向传播网络,S3、根据满足生成完整反向传播网络的需要,设计用户配置信息格式,将配置信息融入上步骤的模型定义文件中。本发明可以自动产生包括正向传播神经网络、反向传播神经网络、运行控制块和辅助算子的模型文件,从而进行训练任务。
-
公开(公告)号:CN114218881A
公开(公告)日:2022-03-22
申请号:CN202110481466.8
申请日:2021-04-30
申请人: 无锡江南计算技术研究所
IPC分类号: G06F30/3308
摘要: 本发明公开一种针对百量子级方形量子网格随机电路模拟方法,在利用张量网络方法对量子随机电路进行模拟的过程中,于是将张量网络切割成较小的张量片,存在不同的节点上;包括以下步骤:S1、将张量网络沿中线切割m次,以降低张量收缩路径中产生的最大张量片的阶数;S2、沿张量网络中线每切割1次,生成2^(L/8)个,独立的并行任务,将这些独立的任务分在不同的进程上并行计算,每个任务通过计算,得到一个标量结果,其中,L表示电路的层数;S3、将S2中获得的每个任务得到的标量结果相加,得到了张量的单振幅模拟结果。本发明可以降低模拟过程的内存需要,从而满足百量子比特以上量级量子随机电路的模拟需求。
-
公开(公告)号:CN114218736A
公开(公告)日:2022-03-22
申请号:CN202110453194.0
申请日:2021-04-26
申请人: 无锡江南计算技术研究所
IPC分类号: G06F30/20 , G06F15/16 , G06F119/08
摘要: 本发明公开一种针对海洋模式ROMS众核优化的方法,包括以下步骤:S1、查找、确认并分析海洋模式中的热点函数,找出热点函数的特点;S2、根据S1中的分析结果,找出排名前三的热点函数都是属于计算密集型、不涉及数据相关性、但存在跨步访存问题的函数;S3、对S2中获得的热点函数的计算部分,利用循环段程序重构,将跨步访存变为连续访存;S4、利用编译指示语句对循环段进行众核优化,将循环段计算任务分发到不用的众核上;S5、对编译指示语句进行调优,通过多轮对比测试,作为最终的优化版本,可供模式其他算例使用。本发明在提升主核访存性能的同时,也有利于从核进行灵活的分块和合并等操作,还可以达到众核加速的效果。
-
公开(公告)号:CN114218264A
公开(公告)日:2022-03-22
申请号:CN202110347429.8
申请日:2021-03-31
申请人: 无锡江南计算技术研究所
IPC分类号: G06F16/2455
摘要: 本发明公开一种基于握手协议的多核间缓存刷新方法,包括以下步骤:发起核通过核间中断向其他核发起缓存刷新请求;发起核死等轮询其他核是否完成缓存刷新操作并计时;其他核接受到来自发起核的缓存刷新请求后,中断进入缓存刷新函数入口,完成缓存刷新;其他核向发起核告知缓存刷新任务完成,并死等轮询发起核的下一步命令;其他核收到发起核的任务退出命令,向发起核发送任务结束答复,并结束此次刷新任务。本发明方法可以保证操作系统完成该方法后的某个时间段内,所有处理器多核缓存的状态是干净的,避免多核间的由于资源竞争导致死锁问题。
-
公开(公告)号:CN114218149A
公开(公告)日:2022-03-22
申请号:CN202110480191.6
申请日:2021-04-30
申请人: 无锡江南计算技术研究所
IPC分类号: G06F15/167 , G06F15/177
摘要: 本发明公开一种众核处理器上从核局存空间动态管理方法,主核进程在每个从核上启动一个守护线程,并根据程序执行流程,请求从核守护线程执行指定的从核子函数,包括建立新的数据环境、执行加速段子函数、撤销当前的数据环境,或请求从核线程终止运行。本发明可消除空间申请、释放的管理开销,提高从核局存空间的利用率,避免局存空间碎片化现象,增加从核线程栈可用的空间。
-
公开(公告)号:CN114218066A
公开(公告)日:2022-03-22
申请号:CN202110480188.4
申请日:2021-04-30
申请人: 无锡江南计算技术研究所
IPC分类号: G06F11/36
摘要: 本发明公开一种基于时空特性数据的调试调优方法,包括以下步骤:S1、采样控制模块配置所需采集的指标并启动采集;S2、性能指标采集模块采集性能指标,通过时间采集模块、空间采集模块分别采集当前性能指标所处的时间和代码空间,其中时间指标通常用处理器周期数表示,空间指标通常用程序的PC值表示;S3、在被监测代码运行结束时,通过采样控制模块结束采集并生成时空特性数据;S4、调用调优模块分析S3中生成的时空特性数据,分析出被监测代码的性能情况;S5、调用调试模块分析S3中生成的时空特性数据,分析程序是否存异常进程。本发明可以同时实现性能监测与程序调试,使用户在程序调优阶段能够快速定位优化导致的程序错误。
-
公开(公告)号:CN114218065A
公开(公告)日:2022-03-22
申请号:CN202110453215.9
申请日:2021-04-26
申请人: 无锡江南计算技术研究所
IPC分类号: G06F11/36
摘要: 本发明公开一种指令流一致性测试方法,S1、初始化各项参数;S2、读入命令行参数;S3、设置共享空间的大小,申请共享的可执行空间;S4、Fork进程,并将进程绑定在不同核心上;S5、进入指令Cache测试入口模块,初始化由随机数组成的数组,并添加前缀指令;S6、进入自动测试模块;S7、进入执行指令模块;S8、执行指令模块运行结束,并进入结束测试模块;S9、在结束测试模块中,判断是否超过设定的执行遍数,如果超过,则进行结果校验,如果没超过,则再次进入自动测试模块;S10、结束测试后,汇报测试结果并回收进程,然后退出并结束。本发明解决了指令Cache一致性验证困难的问题。
-
公开(公告)号:CN114218064A
公开(公告)日:2022-03-22
申请号:CN202110426746.9
申请日:2021-04-20
申请人: 无锡江南计算技术研究所
摘要: 本发明公开一种基于遗传算法的极端测试用例生成方法,包括以下步骤:S1、种群生成器生成初始种群;S2、适应值计算器对S1中获得的初始种群中每个个体进行适应值计算;S3、适应值收集模块收集所有个体的适应值,并反馈给遗传算法核心;S4、遗传算法核心判断是否获得近优解,得到近优解并跳转到S5,若还未获得近优解,遗传算法核心根据上一代的适应值结果,交叉和变异产生多组指令序列,并由种群生成器嵌入汇编代码,生成下一代种群,跳转到S2;S5、得到近优解汇编代码。本发明不需要人工排指令来编写极端测试用例,可以自动生成特定的极端测试用例。
-
公开(公告)号:CN114218062A
公开(公告)日:2022-03-22
申请号:CN202110425772.X
申请日:2021-04-20
申请人: 无锡江南计算技术研究所
IPC分类号: G06F11/36
摘要: 本发明公开一种测试程序批量变种方法,包括以下步骤:S1、对测试程序源码进行分析,确定核心代码段区间;S2、得到核心段代码调用的函数代码;S3、对于改变程序执行路径的测试程序,将其核心代码段进行复制并使用if/else结构对两段相同的核心代码段进行区分,将S2得到的核心段代码调用的函数代码复制,将其中一份函数代码的函数名加上后缀,同时将if/else结构中if条件内的代码段调用的函数加上后缀;S4、得到变种程序源码;S5、将变种程序源码编译成汇编代码;S6、得到变种汇编代码;S7、将变种汇编代码编译成可执行文件。本发明解决了高速缓存一致性测试程序集合中的程序不够丰富,覆盖面不够全面的问题。
-
公开(公告)号:CN114218021A
公开(公告)日:2022-03-22
申请号:CN202110347331.2
申请日:2021-03-31
申请人: 无锡江南计算技术研究所
IPC分类号: G06F11/22
摘要: 本发明公开一种基于RNIC的多核处理器上消息性能故障定位方法,包括以下步骤:S1:在存控K上申请两片内存空间;S2:按K递增的顺序,通过RNIC串行将存控K中的发送数据发送到存控K中的接收数据中,进行第K+1轮测试;S3:得到测试性能数据bwK;S5:在存控K上申请两片内存空间;S6:通过RNIC并行将存控K中的发送数据发送到存控K+S中的接收数据中,进行第step=S+1轮测试;S7:计算消息性能bwS_K;S8:通过判断bwS_K是否低于最低带宽阈值bw_threshold来判断故障原因。本发明解决了基于RNIC的多核处理器上消息性能故障定位难的问题。
-
-
-
-
-
-
-
-
-