-
公开(公告)号:CN111147045B
公开(公告)日:2021-11-05
申请号:CN201911340498.5
申请日:2019-12-23
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种超导电路的清零方法及系统,包括:发送清零指令信号至非破坏读出寄存器的指令输入接口,非破坏读出寄存器根据高频局部时钟信号输出数据至第一磁通量子分离器件,第一磁通量子分离器件将输出数据分离为清零信号和触发信号,并将清零信号输入至超导处理器各流水级之间的超导寄存器;输入低频系统时钟信号至第二磁通量子分离器件,第二磁通量子分离器件将低频系统时钟信号拆分为第一低频系统时钟脉冲和第二低频系统时钟脉冲;第一D触发器根据触发信号和第一低频系统时钟脉冲,输出信号脉冲,第二磁通量子分离器件根据信号脉冲和第二低频系统时钟脉冲,输出延时脉冲,非破坏读出寄存器根据延时脉冲进行复位,以停止输出清零信号。
-
公开(公告)号:CN111049503A
公开(公告)日:2020-04-21
申请号:CN201911316279.3
申请日:2019-12-19
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种超导触发器及其运行方法,包括:磁通量子分离器件、可复位触发器和非破坏读出寄存器;该磁通量子分离器件的输入端用于接收该超导触发器的使能信号,该磁通量子分离器件的输出端与该非破坏读出寄存器的复位输入端相连,该磁通量子分离器件的另一输出端与可复位触发器的时钟输入端相连;该可复位触发器的输入端作为该超导触发器的输入端,该可复位触发器的复位端用于接收该超导触发器的清空信号,该可复位触发器的输出端与该非破坏读出寄存器的输入端相连;该非破坏读出寄存器的时钟输入端作为该超导触发器的时钟输入端,该非破坏读出寄存器的输出端作为该超导触发器的输出端。
-
公开(公告)号:CN111049503B
公开(公告)日:2021-10-22
申请号:CN201911316279.3
申请日:2019-12-19
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种超导触发器及其运行方法,包括:磁通量子分离器件、可复位触发器和非破坏读出寄存器;该磁通量子分离器件的输入端用于接收该超导触发器的使能信号,该磁通量子分离器件的输出端与该非破坏读出寄存器的复位输入端相连,该磁通量子分离器件的另一输出端与可复位触发器的时钟输入端相连;该可复位触发器的输入端作为该超导触发器的输入端,该可复位触发器的复位端用于接收该超导触发器的清空信号,该可复位触发器的输出端与该非破坏读出寄存器的输入端相连;该非破坏读出寄存器的时钟输入端作为该超导触发器的时钟输入端,该非破坏读出寄存器的输出端作为该超导触发器的输出端。
-
公开(公告)号:CN112288085B
公开(公告)日:2024-04-09
申请号:CN202011147836.6
申请日:2020-10-23
Applicant: 中国科学院计算技术研究所
IPC: G06N3/082 , G06N3/0464
Abstract: 本发明提出一种卷积神经网络加速方法及系统,包括将待特征分析的图像作为输入激活输入卷积神经网络,分解该卷积神经网络中滤波器的权值向量,得到滤波器中权值对应的符号向量;通过符号向量与输入激活向量执行卷积运算,得到第一卷积结果,通过补偿因子与输入激活向量执行卷积运算,得到第二卷积结果,将该第一卷积结果和第二卷积结果相加,得到预测结果;该卷积神经网络执行卷积计算时根据该预测结果跳过0值相关的运算,得到卷积结果。本发明可预知输出激活的稀疏度,以指导原始的神经网络运算跳过0值相关的运算,从而减少原始网络的计算量,节省计算资源、降低功耗并提升性能。
-
公开(公告)号:CN112015473B
公开(公告)日:2023-06-27
申请号:CN202010719417.9
申请日:2020-07-23
Applicant: 中国科学院计算技术研究所
IPC: G06F9/30 , G06F9/32 , G06N3/10 , G06N3/0464 , G06N3/0495 , G06N3/082
Abstract: 本发明提出一种基于数据流架构的稀疏卷积神经网络加速方法及系统。针对稀疏卷积应用,使用软件方式设计了一套指令共享检测装置和稀疏卷积加速方法。通过对编译器生成的指令进行检测和对比,标记所有指令中指令内容完全相同的指令,将这些指令的地址设置为相同的地址,实现稀疏卷积中指令共享,从而减少了指令加载对内存的访问,提升了稀疏卷积运行的时间。
-
公开(公告)号:CN112015472A
公开(公告)日:2020-12-01
申请号:CN202010685107.X
申请日:2020-07-16
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种数据流架构中无效指令检测并跳过执行的方法,适用于数据流架构下稀疏卷积神经网络的加速。该发明对于稀疏神经网络,包括卷积层和全连接层。通过对编译器编译的指令,依据数据特征生成指令标记信息,指令检测单元又依据指令标记信息对指令进行检测,并跳过无效指令的执行,从而实现稀疏卷积神经网络的加速。
-
公开(公告)号:CN111147045A
公开(公告)日:2020-05-12
申请号:CN201911340498.5
申请日:2019-12-23
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种超导电路的清零方法及系统,包括:发送清零指令信号至非破坏读出寄存器的指令输入接口,非破坏读出寄存器根据高频局部时钟信号输出数据至第一磁通量子分离器件,第一磁通量子分离器件将输出数据分离为清零信号和触发信号,并将清零信号输入至超导处理器各流水级之间的超导寄存器;输入低频系统时钟信号至第二磁通量子分离器件,第二磁通量子分离器件将低频系统时钟信号拆分为第一低频系统时钟脉冲和第二低频系统时钟脉冲;第一D触发器根据触发信号和第一低频系统时钟脉冲,输出信号脉冲,第二磁通量子分离器件根据信号脉冲和第二低频系统时钟脉冲,输出延时脉冲,非破坏读出寄存器根据延时脉冲进行复位,以停止输出清零信号。
-
公开(公告)号:CN112015472B
公开(公告)日:2023-12-12
申请号:CN202010685107.X
申请日:2020-07-16
Applicant: 中国科学院计算技术研究所
IPC: G06F9/30 , G06F9/32 , G06N3/10 , G06N3/0464 , G06N3/0495 , G06N3/082
Abstract: 本发明提出一种数据流架构中无效指令检测并跳过执行的方法,适用于数据流架构下稀疏卷积神经网络的加速。该发明对于稀疏神经网络,包括卷积层和全连接层。通过对编译器编译的指令,依据数据特征生成指令标记信息,指令检测单元又依据指令标记信息对指令进行检测,并跳过无效指令的执行,从而实现稀疏卷积神经网络的加速。
-
公开(公告)号:CN112288085A
公开(公告)日:2021-01-29
申请号:CN202011147836.6
申请日:2020-10-23
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种卷积神经网络加速方法及系统,包括将待特征分析的图像作为输入激活输入卷积神经网络,分解该卷积神经网络中滤波器的权值向量,得到滤波器中权值对应的符号向量;通过符号向量与输入激活向量执行卷积运算,得到第一卷积结果,通过补偿因子与输入激活向量执行卷积运算,得到第二卷积结果,将该第一卷积结果和第二卷积结果相加,得到预测结果;该卷积神经网络执行卷积计算时根据该预测结果跳过0值相关的运算,得到卷积结果。本发明可预知输出激活的稀疏度,以指导原始的神经网络运算跳过0值相关的运算,从而减少原始网络的计算量,节省计算资源、降低功耗并提升性能。
-
公开(公告)号:CN112015473A
公开(公告)日:2020-12-01
申请号:CN202010719417.9
申请日:2020-07-23
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种基于数据流架构的稀疏卷积神经网络加速方法及系统。针对稀疏卷积应用,使用软件方式设计了一套指令共享检测装置和稀疏卷积加速方法。通过对编译器生成的指令进行检测和对比,标记所有指令中指令内容完全相同的指令,将这些指令的地址设置为相同的地址,实现稀疏卷积中指令共享,从而减少了指令加载对内存的访问,提升了稀疏卷积运行的时间。
-
-
-
-
-
-
-
-
-