一种基于数据流架构的深度可分离卷积融合方法及系统

    公开(公告)号:CN113313251B

    公开(公告)日:2023-05-23

    申请号:CN202110522385.8

    申请日:2021-05-13

    Abstract: 本发明提出一种基于数据流架构的深度可分离卷积融合方法和系统,包括:将输入图像数据、卷积参数从主存DRAM搬运到数据缓存SPM;PE阵列通过从数据缓存SPM中读取该输入图像数据、卷积参数,以执行DW卷积,并将得到的DW卷积结果存储在PE内的寄存器中;PE阵列对寄存器中DW卷积结果进行激活计算得到该输入图像数据的初步结果Act_out,将该初步结果Act_out写回数据缓存SPM后,进一步存回主存;PE阵列通过从数据缓存SPM中读取初步结果Act_out与卷积参数,执行PW卷积得到最终结果Output;将最终结果Output写回数据缓存SPM后,进一步存回主存DRAM。本发明减少了数据的存储与访问带来的开销,使得深度可分离式卷积计算在数据流架构上的计算实现加速。

    生成面向超导RSFQ电路的多扇出时钟信号的方法

    公开(公告)号:CN111950215B

    公开(公告)日:2023-04-28

    申请号:CN202010703091.0

    申请日:2020-07-21

    Abstract: 提供一种生成面向超导RSFQ电路的多扇出时钟信号的方法,其中N是扇出时钟信号的数量,N个扇出时钟信号的每一个与从时钟源点到时钟端点所经过的由SPL构成的分支路径相对应,由SPL构成的分支路径构成SPL树,所述方法包括:建立高度P为1的SPL树,将其存入集合R;根据N计算SPL树的最大高度Pmax;自底向上逐层建立SPL树,每次迭代P增加1,直到P>Pmax,并将所得到的SPL树存入集合R中;选择所述集合R中叶节点数为N的树构成最优解;根据所述最优解确定多扇出时钟信号的由SPL构成的分支路径;其中,高度为P的树是由所述集合R中高度为P‑1的子树组成的。

    超导处理器及其输入输出控制模块

    公开(公告)号:CN112861463B

    公开(公告)日:2023-04-25

    申请号:CN202110266205.4

    申请日:2021-03-11

    Abstract: 提供一种用于超导处理器的输入输出控制模块,包括:取指令状态寄存器,用于指示取指令状态或者非取指令状态,以及用于将指令地址输出到内存;读数据等待状态寄存器,用于根据处理器的读数据请求以及取指令状态寄存器由取指令状态转换至非取指令状态,将读数据地址由暂存转换为输出到内存;读数据状态寄存器,用于指示读数据状态,以及用于将读数据地址输出到内存;写数据等待状态寄存器,用于根据处理器的写数据请求以及取指令状态寄存器由取指令状态转换至非取指令状态,将写数据地址和写数据内容由暂存转换为输出到内存;写数据状态寄存器,用于指示写数据状态,以及用于将写数据地址和写数据内容输出到内存。

    一种超导流水线电路及处理器

    公开(公告)号:CN112116094B

    公开(公告)日:2022-08-30

    申请号:CN202010875646.X

    申请日:2020-08-27

    Abstract: 提供一种超导流水线电路,至少包括:第一可清零寄存器组、第一逻辑组合电路、第二可清零寄存器组以及第二逻辑组合电路,其中第一和第二可清零寄存器组用于在使能信号的控制下接收数据输入,并在第一时钟的控制下,将接收的输入数据进行输出;第一逻辑组合电路接收第一可清零寄存器组的输出数据,并在第一时钟的控制下将该数据运算之后输出至第二可清零寄存器组;第二逻辑组合电路接收第二可清零寄存器组的输出数据,并在第一时钟的控制下将该数据运算之后进行输出;其中,第二逻辑组合电路还用于生成内部清零信号以及阻塞信号;阻塞信号用于控制使能信号的有效和无效,以及内部清零信号用于控制第一和第二可清零寄存器组清零。

    一种用于分布式训练计算阶段的自动优化方法

    公开(公告)号:CN114911621A

    公开(公告)日:2022-08-16

    申请号:CN202210553734.7

    申请日:2022-05-20

    Abstract: 本发明提供一种用于分布式训练计算阶段的自动优化方法,所述方法包括在分布式训练的每个回合执行如下步骤:S1、以预设的最小单位负载为粒度,计算当前回合中参与分布式训练的所有节点的计算性能;S2、以计算性能最差的节点计算其对应的最大允许负载数的完成时间为限制时间,分别计算每个节点在限制时间内能够完成计算的最大负载数,以所有节点在限制时间内对应的能够完成计算的最大负载数组成负载分配策略;S3、以步骤S2中负载分配策略,分配下一回合每个计算节点的负载。其中,节点的计算性能是该节点完成预设最小单位负载计算的时间。

    一种片上SRAM阵列存储装置及AI神经网络图像数据存储方法

    公开(公告)号:CN114860169A

    公开(公告)日:2022-08-05

    申请号:CN202210510935.9

    申请日:2022-05-11

    Abstract: 本发明提供一种片上SRAM阵列存储装置,所述装置包括多个并列的bank块,每个bank块包括数量相同的连续的多个SRAM单元,每个SRAM单元包括连续的多行存储空间,不同bank块中的同一位置的SRAM单元组成一个SRAM单元行,其中,各个bank块中的各个SRAM单元按照如下方式进行编址:以第一个SRAM单元行中的第一个SRAM单元为起点进行顺序编址,以使相邻地址分散在不同bank块中;相邻SRAM单元行中,后一个SRAM单元行的第一个SRAM单元在前一个SRAM单元行的最后一个SRAM单元的地址的基础上顺序编址。

    一种数据转发装置及方法

    公开(公告)号:CN114629555A

    公开(公告)日:2022-06-14

    申请号:CN202210310677.X

    申请日:2022-03-28

    Abstract: 本发明提供了一种数据转发装置,其输入端与输出端均与传输光纤相连,所述装置包括:光纤分路器,将输入的光信号复制为多份光信号;光直通转发模块,接收光纤分路器的一条分路输出的光信号并将需要转发的光信号直接以光信号形式经过光纤选路器传输到输出端的传输光纤;光电转换模块,接收光纤分路器的一条分路输出的光信号并转换为电信号且以数据包形式进行缓存;控制模块,接收光纤分路器的一条分路输出的光信号,以根据光信号的目的地址判断光信号是否需要转发,并结合输出端传输光纤的工作状态针对需要转发和不需要转发的光信号分别输出相应的控制命令;光纤选路器,在控制模块输出的控制下选择光直通转发模块或光电转换模块与输出端传输光纤连通。

    基于深度线索的视频场景检索方法和系统

    公开(公告)号:CN109241342B

    公开(公告)日:2022-04-19

    申请号:CN201810811468.7

    申请日:2018-07-23

    Abstract: 本发明涉及一种基于深度线索的视频场景检索方法和系统,包括:获取样本视频,并将样本视频作为输入视频;将输入视频分割为场景片段,根据场景片段的视频场景信息,提取深度线索,对深度线索构成的空间数据降维,作为空间信息描述子;对输入视频进行帧采样得到关键帧,提取关键帧的特征,作为彩色信息描述子;建立空间信息描述子与彩色信息描述子的索引关系,得到场景描述子;对所有样本视频的场景描述子建立视频场景特征库;获取待检索视频,并作为输入视频,得到待检索视频的空间描述子与彩色信息描述子,并根据待检索视频的空间描述子,检索视频场景特征库,得到初步检索结果,对初步检索结果进行彩色特征筛选得到待检索视频的最终检索结果。

    一种数据传输装置及传输方法

    公开(公告)号:CN111459856B

    公开(公告)日:2022-02-18

    申请号:CN202010200676.0

    申请日:2020-03-20

    Abstract: 本发明提供一种数据传输装置,包括:控制逻辑,其用于根据配置信息产生相应的控制信号以控制其他模块的动作;其中,存储体接口逻辑用于从存储体中读取数据或向存储体写入数据;第一选择逻辑用于选择与正向传输模式对应的数据传输路径或与反向传输模式对应的数据接收路径;数据对齐逻辑用于对传输的数据进行对齐操作;重组模块用于对传输的数据进行重组操作以将存储体中读出的数据块拆分成数据分量的形式并重组成新的数据块后传递给片上存储结构进行处理,或将片上存储结构处理后的数据块拆分成数据分量形式并重组成数据块写入存储体;第二选择逻辑用于选择与正向传输模式对应的数据接收路径或与反向传输模式对应的数据传输路径;数据路由逻辑用于确定数据传输的目的地址。

    一种独立于操作系统的计算机系统内存检测方法及系统

    公开(公告)号:CN113407372A

    公开(公告)日:2021-09-17

    申请号:CN202110608493.7

    申请日:2021-06-01

    Abstract: 本发明提出一种独立于操作系统的计算机系统内存检测方法及系统,通过JTAG设备将本发明的内存检测程序写入到计算机系统内存,即可使其运行在计算机系统启动初期,即在计算机系统固化代码段执行结束,初始化基本硬件后在bootloader运行之前;通过对内存的写0、写1以及写入经过处理的地址值并进行回读的三种方式对内存进行循环多次检测。本发明提供的内存检测方法可以应用于计算机操作系统无法工作或无操作系统的场景,并且能够快速准确的检测出内存设备本身是否存在地址线和数据线连接问题,以及可以检测出内存设备的地址线和数据线恒0、恒1以及短路的问题。

Patent Agency Ranking