一种用于探索CPU微架构的设计空间的方法和装置

    公开(公告)号:CN117933073A

    公开(公告)日:2024-04-26

    申请号:CN202410057102.0

    申请日:2024-01-15

    摘要: 本发明提供了一种用于探索CPU微架构的设计空间的方法和装置,该方法包括:获取所有设计点和负载;利用运行负载的模拟器对部分设计点进行模拟输出对应的性能指标,并构建训练集训练性能预测模型;利用经训练的性能预测模型预测剩余设计点的性能指标,并执行以下操作:计算设计点的超体积值并确定候选设计点,若有候选设计点,将该候选设计点输入模拟器;若没有候选设计点,利用预设选择算法选择一个设计点输入模拟器;判断训练集中设计点的数量与所有设计点的数量的比值是否超过预设阈值,若否,对输入的设计点进行模拟并输出性能指标,将其加入训练集对性能预测模型进行迭代训练;若是,根据帕累托等级算法计算并输出CPU微架构的帕累托最优解集。

    超导寄存器堆装置及其控制方法

    公开(公告)号:CN113128172B

    公开(公告)日:2023-10-27

    申请号:CN202110439614.X

    申请日:2021-04-23

    IPC分类号: G06F30/398

    摘要: 提供一种超导寄存器堆装置,包括m个寄存器组,每个寄存器组包括n个寄存器单元,其中m和n均为大于等于2的整数。每个寄存器单元包括用于接收数据输入的数据输入端,用于接收写入控制信号的写入控制端,用于接收时钟信号的时钟输入端,以及用于将数据输出的数据输出端。其中,m个寄存器组的相同位的寄存器单元的数据输入端通过多个SPL器件连接在一起;m个寄存器组的相同位的寄存器单元的数据输出端通过多个CB器件连接在一起。

    用于双时钟架构的超导RSFQ电路布局方法

    公开(公告)号:CN113095033B

    公开(公告)日:2023-07-21

    申请号:CN202110442343.3

    申请日:2021-04-23

    摘要: 提供一种用于双时钟架构的超导RSFQ电路的布局方法,所述电路中除输入IO以及输出IO之外的逻辑单元总数为N,布局所述电路的芯片的宽高比为α,所述布局方法包括:基于逻辑深度对N个逻辑单元进行初始布局,包括:计算布局列的参考高度从逻辑深度为1开始依次布置逻辑单元,使得每个逻辑深度的单元按照垂直方向递增的顺序依次布置,且每一列的高度不大于H0,不同的逻辑深度从新的一列开始布置;将单元数小于H0的列依序进行合并,且合并后的列的高度不大于H0;以及移除空的列,并输出N个逻辑单元在芯片上的初始坐标以及可布局的列;基于模拟退火布局框架对初始布局进行扰动和优化。

    一种超导二值神经网络加速方法及加速器

    公开(公告)号:CN114841102A

    公开(公告)日:2022-08-02

    申请号:CN202210513312.7

    申请日:2022-05-11

    IPC分类号: G06F30/331 G06N3/04 G06N3/06

    摘要: 本发明提出一种超导二值神经网络加速方法和加速器,包括:获取待运行的神经网络第一层所有的实值权重和实值激活,分别作为当前权重和当前激活,并二值化当前权重和当前激活,得到二值权重和二值激活;将所有二值权重及其对应的二值激活构成的数据对,输入至神经处理单元中的多个同或门,以对各个数据对完成乘法运算;通过纯组合累加并行单元对所有乘法运算结果进行累加,并将累加结果和预设阈值输入至比较器,并将比较结果作为下一层的二值激活,直到得到超导二值神经网络最后一层的比较结果,作为超导二值神经网络的运行结果。本发明使BNN中第一层也可进行二值化计算,且不会损失精度;本发明还避免了反馈环和存储电路,提高超导BNN的性能。

    一种超导并行寄存器堆装置
    6.
    发明公开

    公开(公告)号:CN112114875A

    公开(公告)日:2020-12-22

    申请号:CN202010876462.5

    申请日:2020-08-27

    IPC分类号: G06F9/30

    摘要: 提供一种超导并行寄存器堆装置,该装置包括N个寄存器组,其中N为大于等于2的整数,该N个寄存器组分别包括用于接收数据输入的数据输入端,用于接收写数据地址的写地址输入端,用于接收写使能信号的写使能端,用于接收时钟信号的时钟输入端,用于接收读数据地址的读地址输入端以及用于将数据输出的数据输出端;其中,该N个寄存器组的数据输入端连接在一起,该N个寄存器组的写地址输入端连接在一起,以及该N个寄存器组的写使能端连接在一起。

    生成面向超导RSFQ电路的多扇出时钟信号的方法

    公开(公告)号:CN111950215A

    公开(公告)日:2020-11-17

    申请号:CN202010703091.0

    申请日:2020-07-21

    摘要: 提供一种生成面向超导RSFQ电路的多扇出时钟信号的方法,其中N是扇出时钟信号的数量,N个扇出时钟信号的每一个与从时钟源点到时钟端点所经过的由SPL构成的分支路径相对应,由SPL构成的分支路径构成SPL树,所述方法包括:建立高度P为1的SPL树,将其存入集合R;根据N计算SPL树的最大高度Pmax;自底向上逐层建立SPL树,每次迭代P增加1,直到P>Pmax,并将所得到的SPL树存入集合R中;选择所述集合R中叶节点数为N的树构成最优解;根据所述最优解确定多扇出时钟信号的由SPL构成的分支路径;其中,高度为P的树是由所述集合R中高度为P-1的子树组成的。

    一种基于超导快速单磁通量子逻辑门的数字突触电路

    公开(公告)号:CN118153696A

    公开(公告)日:2024-06-07

    申请号:CN202311799038.5

    申请日:2023-12-25

    IPC分类号: G06N10/20 G06N10/40 G06N3/063

    摘要: 本发明提出一种基于超导快速单磁通量子逻辑门的数字突触电路,包括:控制模块,用于接收时钟信号和突触前神经元的脉冲序列,并控制权重序列的产生;由两输出T型触发器级联的TFF2触发器序列,该触发器序列接收该脉冲序列用于解码存储权重数据的非破坏性读取(NDRO)序列;由NDRO级联的NDRO序列,用于存储权重数据;突触配置模块,与该NDRO序列中各NDRO的置位端与复位端相连;其中,该触发器序列中触发器的第一输出端口接至该NDRO序列中对应的NDRO,该触发器序列中最后一级触发器的输出端口产生终止信号至该控制模块;该NDRO序列中各NDRO输出的脉冲合并,得到合并脉冲。

    一种超高速、超低功耗的超导神经元电路

    公开(公告)号:CN117829229A

    公开(公告)日:2024-04-05

    申请号:CN202311797379.9

    申请日:2023-12-25

    IPC分类号: G06N3/063 G06N10/40 G06N10/20

    摘要: 本发明提出一种超高速、超低功耗的超导神经元电路,包括串联的第一约瑟夫森结、第二约瑟夫森结、第三约瑟夫森结和电感;为超导神经元电路的输入端施加偏置电流,偏置电流通过第一约瑟夫森结接地,同时偏置电流也可以通过第二约瑟夫森结、第三约瑟夫森结和电感接地;第一约瑟夫森结,用于接收输入端的脉冲输入并产生相位差翻转,翻转后释放磁通量子,磁通量子通过第三约瑟夫森结存入电感;第二约瑟夫森结,与电感的输出端相连,当电感内存储的磁通量子超过一定数量时,会导致通过第二约瑟夫森的电流超过临界值,随后第二约瑟夫森结翻转并发出一个脉冲信号至超导神经元电路的输出端。采用电感作为磁通量子的收集部件,避免了存储电路的消耗。

    生成面向超导RSFQ电路的多扇出时钟信号的方法

    公开(公告)号:CN111950215B

    公开(公告)日:2023-04-28

    申请号:CN202010703091.0

    申请日:2020-07-21

    摘要: 提供一种生成面向超导RSFQ电路的多扇出时钟信号的方法,其中N是扇出时钟信号的数量,N个扇出时钟信号的每一个与从时钟源点到时钟端点所经过的由SPL构成的分支路径相对应,由SPL构成的分支路径构成SPL树,所述方法包括:建立高度P为1的SPL树,将其存入集合R;根据N计算SPL树的最大高度Pmax;自底向上逐层建立SPL树,每次迭代P增加1,直到P>Pmax,并将所得到的SPL树存入集合R中;选择所述集合R中叶节点数为N的树构成最优解;根据所述最优解确定多扇出时钟信号的由SPL构成的分支路径;其中,高度为P的树是由所述集合R中高度为P‑1的子树组成的。