深度神经网络模型并行模式选择方法

    公开(公告)号:CN112541584A

    公开(公告)日:2021-03-23

    申请号:CN201910897718.8

    申请日:2019-09-23

    Abstract: 本发明公开一种深度神经网络模型并行模式选择方法,包括以下步骤:S1、测算整个神经网络模型的总数据量;S2、判断S1中获得的神经网络模型的总数据量是否超过进行训练的单个计算节点的可用内存总量,如果不超过,执行S3,如果超过,执行S4;S3、选择数据并行模式;S4、将神经网络模型的网络层进行切分,根据切分的结果,得到神经网络模型所需要分布的计算节点数量,如果输入参数中的计算节点数量不足模型切分所需节点数量两倍以上,执行S5,否则执行S6;S5、选择模型并行模式;S6、选择包括数据并行和模型并行的混合并行模式。本发明通过对模型参数、超参数和数据量的信息采集和分析,实现分布式扩展并行模式的自动选择,并且保证较高的并行性能。

    面向申威众核架构的稀疏矩阵存储方法

    公开(公告)号:CN112540718A

    公开(公告)日:2021-03-23

    申请号:CN201910898286.2

    申请日:2019-09-23

    Abstract: 本发明公开一种面向申威众核架构的稀疏矩阵存储方法,所述众核处理器由4个异构群构成,每个异构群包括一个主核、64个从核构成的从核簇、异构群接口和存储控制器,整芯片有260个计算核心;所述稀疏矩阵存储格式包括以下步骤:S1、将稀疏矩阵按行在申威众核处理器的核组阵列上分组,每个从核分到的若干行为一组,将64个从核分为64组;S2、对每组内的稀疏矩阵非零元素按列压缩存储,通过保存稀疏矩阵每列包含的非零元数量而对列坐标进行压缩,需要保存列索引、行坐标和非零元值,完成存储。本发明能够为应用软件基于众核处理器的全过程求解提供一种统一的数据组织形式,从而提高该类问题对申威众核架构适应性。

    大规模异构并行计算的容错方法

    公开(公告)号:CN102929738B

    公开(公告)日:2015-02-11

    申请号:CN201210442295.9

    申请日:2012-11-06

    Abstract: 本发明提供了一种大规模异构并行计算的容错方法,包括:对每个时间步的每个核心计算模块,进行以下处理:将计算课题的计算数组的内容赋值给备份数组;完成核心计算模块的计算;其中,完成核心计算模块的计算包括:统计可用处理器核数,以获得第一处理器核数;可用处理器核并行运算核心计算模块;再次统计可用处理器核数,以获得第二处理器核数;比较第一处理器核数和第二处理器核数,若第二处理器核数小于第一处理器核数,则将备份数组的内容赋值给计算数组,并重新完成核心计算模块的计算,直至第一处理器核数与第二处理器核数一致。本发明的大规模异构并行计算容错方法能充分利用计算资源,减少故障恢复时间,提高并行计算的可靠性。

    一种小分子化学体系的哈密顿量模拟方法和装置

    公开(公告)号:CN115169565A

    公开(公告)日:2022-10-11

    申请号:CN202211098612.X

    申请日:2022-09-09

    Abstract: 本发明公开一种小分子化学体系的哈密顿量模拟方法和装置,该方法包括:步骤一,首先在经典计算机上根据电子体系轨道数生成Hatree‑Fock初态,二次量子化哈密顿量,通过JW变换将费米子算符变成泡利算符,生成基于UCCSD ansatz的量子门电路;步骤二,通过量子计算机运行量子门电路;步骤三,在经典计算机上,运用分组启发式优化算法,优化并更新量子门电路的参数;步骤四,将更新参数后的量子门电路再次通过量子计算机运行,以此循环迭代直至收敛,计算出哈密顿量的特征。本发明通过经典‑量子结合的方法,克服经典计算遇到的“指数墙”困难,结合经典启发式优化算法,有效缓解误差,避免了量子计算机的噪声等问题。

    一种用于成像和光刻系统的共路光束调制装置

    公开(公告)号:CN110568650A

    公开(公告)日:2019-12-13

    申请号:CN201910853082.7

    申请日:2019-09-10

    Abstract: 本发明公开了一种用于成像和光刻系统的共路光束调制装置。由淬灭光束或去交联光束构成第一光束,由激发光束或交联光束构成第二光束;光束合束后依次透过第一光学薄膜、玻璃基板、第二光学薄膜,第一光束经第二光学薄膜、透明电极进入液晶层,经反射层反射,第二次进入液晶层,经液晶层相位调制后,最终从第一光学薄膜出射;第二光束经第二光学薄膜反射后最终经第一光学薄膜出射。上述方法使两束光束合束后再经过同一光调制模块,而仅对淬灭光束或去交联光束相位调制,这大大简化了光学成像和光刻系统的结构,并且由于使共路系统,其稳定性更好,本发明装置可以大大降低成像与光刻系统的搭建成本并且提高了系统的抗干扰能力,光学效率较高。

    一种CAD模型生成方法、装置、存储介质及电子设备

    公开(公告)号:CN119203285A

    公开(公告)日:2024-12-27

    申请号:CN202411353436.9

    申请日:2024-09-26

    Abstract: 本说明书公开了一种CAD模型生成方法、装置、存储介质及电子设备。在本说明书提供的CAD模型生成方法中,获取计算机辅助设计CAD命令序列,作为样本CAD序列;将所述样本CAD序列输入待训练的扩散模型,所述扩散模型包含正向扩散子网和逆向扩散子网;通过所述正向扩散子网将所述样本CAD序列转换为样本嵌入向量,并对所述样本嵌入向量添加噪声,得到样本扩散向量;通过所述逆向扩散子网对所述样本扩散向量进行降噪处理,得到待优化预测向量,并根据所述待优化预测向量确定待优化预测序列;根据所述待优化预测向量与所述样本嵌入向量之间的差异对所述扩散模型进行训练;将训练后的扩散模型包含的逆向扩散子网作为目标模型,并采用所述目标模型生成CAD模型。

    一种量子张量网络转置和收缩协同的方法和装置

    公开(公告)号:CN115146780B

    公开(公告)日:2023-07-11

    申请号:CN202211045996.9

    申请日:2022-08-30

    Abstract: 本发明公开一种量子张量网络转置和收缩协同的方法和装置,基于异构众核处理器,包括:步骤一:根据读取的张量信息,进行张量索引预分类后分块读入异构众核处理器的计算处理单元;步骤二:在计算处理单元中,根据索引信息,对读入的分块张量进行转置;步骤三:再对经过转置后的张量依据索信息进行张量收缩;步骤四:收缩完成后,将收缩结果输出回处理器的内存对应张量块位置并合成完整的新收缩后张量结果。本发明通过高效的张量分块、转置和张量收缩计算策略,合理地避免了中间结果的冗余访存开销,实现了转置和张量收缩计算一体化、提高了张量收缩的速度,有效解决了张量收缩计算时间长、效率低的问题,提高了大规模量子电路计算模拟的速度。

    一种量子张量网络转置和收缩协同的方法和装置

    公开(公告)号:CN115146780A

    公开(公告)日:2022-10-04

    申请号:CN202211045996.9

    申请日:2022-08-30

    Abstract: 本发明公开一种量子张量网络转置和收缩协同的方法和装置,基于异构众核处理器,包括:步骤一:根据读取的张量信息,进行张量索引预分类后分块读入异构众核处理器的计算处理单元;步骤二:在计算处理单元中,根据索引信息,对读入的分块张量进行转置;步骤三:再对经过转置后的张量依据索信息进行张量收缩;步骤四:收缩完成后,将收缩结果输出回处理器的内存对应张量块位置并合成完整的新收缩后张量结果。本发明通过高效的张量分块、转置和张量收缩计算策略,合理地避免了中间结果的冗余访存开销,实现了转置和张量收缩计算一体化、提高了张量收缩的速度,有效解决了张量收缩计算时间长、效率低的问题,提高了大规模量子电路计算模拟的速度。

Patent Agency Ranking