-
公开(公告)号:CN113947181A
公开(公告)日:2022-01-18
申请号:CN202111105826.0
申请日:2021-09-22
摘要: 本发明公开了一种神经网络加速器模型转换方法及装置,方法包括:获取待转换的神经网络模型,对模型网络结构文件进行解析,得到模型所有网络层,对网络层进行重构,映射为神经网络加速器支持的算子节点,最后根据网络拓扑结构将转换后的算子节点及模型权重进行序列化,生成目标文件;装置包括:神经网络模型构建模块、重构模块、映射模块和序列化模块;本发明解决了多种格式模型在神经网络加速器设备上部署的多适配困难问题,能够高效的进行模型转换,生成适配神经网络加速器的模型格式。
-
公开(公告)号:CN113869507A
公开(公告)日:2021-12-31
申请号:CN202111456203.8
申请日:2021-12-02
摘要: 本发明公开了一种基于脉动阵列的神经网络加速器卷积计算装置与方法,该装置的结构由64×64个同构的PE单元构成,组成脉动阵列的形式,包括多个权重输入通道,数据输入通道以及相应的数据(权重)选通有效信号。脉动阵列首行使能开始后,使能信号开始有效,所有数据计算完毕后,使能信号关闭。脉动阵列中权重数据由上往下传递,每个PE单元的计算结果和权重有效信号经过一级寄存器后输入到同一列的下一个PE单元中参与计算。脉动阵列中特征图数据和数据有效信号从左往右传递,经过一级寄存器后输入到一行的下一个PE单元中参与计算。
-
公开(公告)号:CN115168281B
公开(公告)日:2023-01-03
申请号:CN202211098597.9
申请日:2022-09-09
IPC分类号: G06F15/173 , G06N3/04 , G06N3/08
摘要: 本发明涉及计算机高性能计算领域,尤其涉及一种基于禁忌搜索算法的神经网络片上映射方法和装置,该方法构造禁忌搜索表并使用基于启发式的迭代搜索过程,选取局部的片上网络的计算核心作为候选对象,建立整数规划模型并求解最优解,循环迭代不断降低映射解的目标代价函数,最后获得近似最优的部署方案;本发明方法给出的基于最近邻的构造策略和禁忌搜索算法的搜索策略,降低了神经网络模型映射后的目标机器的整体功耗和通信距离总和,极大提高了数据在片上网络的传输效率及整体计算速度。
-
公开(公告)号:CN115022628A
公开(公告)日:2022-09-06
申请号:CN202210930753.7
申请日:2022-08-04
IPC分类号: H04N19/103 , H04N19/91 , H04N19/93
摘要: 本发明公开一种基于JPEG‑LS的高吞吐率无损图像压缩方法,包括:步骤一,访问图像存储器并读取图像,构建读取图像的待编码像素的因果模板;步骤二,计算待编码像素的邻近图像像素间的局部梯度值,若局部梯度值的绝对值小于等于近无损度,则对待编码像素进行游程编码,否则对局部梯度值进行量化、符号校正和合并后进行常规编码;步骤三,经步骤二的编码后输出编码码流,完成对读取图像的压缩编码,若未完成所述读取图像的压缩编码,则返回步骤一重新进行压缩编码。本发明可降低硬件实现复杂度,有效提高该图像压缩算法的时钟频率以及吞吐率。
-
公开(公告)号:CN114611686A
公开(公告)日:2022-06-10
申请号:CN202210511894.5
申请日:2022-05-12
摘要: 本发明公开了基于可编程神经拟态核的突触延时实现系统及方法,包括可编程神经拟态核与拟态核级联扩展模块,可编程神经拟态核包括相互连接的时间信息空间化模块和多阈值脉冲发放模块,时间信息空间化模块分别与映射在网格的源神经元连接,多阈值脉冲发放模块与映射在网格的目标神经元连接;可编程神经拟态核将收到的源神经元不同时间步发放的脉冲转化到膜电位等内部状态上,根据多种发放阈值,采用多阈值脉冲发放方法,脉冲经过多种延时后发给目标神经元,拟态核可以级联,实现多个突触延时的累加。本发明可以同时实现多种突触延时,并且突触延时可扩展为任意延时要求。
-
公开(公告)号:CN114117972B
公开(公告)日:2022-06-10
申请号:CN202210090997.9
申请日:2022-01-26
IPC分类号: G06F30/327 , H03K19/20
摘要: 本发明涉及异步电路之间的信号同步技术领域,具体涉及一种异步电路的同步装置和方法,装置包括发送模块、异步传输模块、接收模块、发送端时钟、接收端时钟,所述发送模块由发送端时钟驱动,产生、更新发送请求和数据,并通过寄存器打拍的方式同步发送响应信号;异步传输模块将来自发送模块的请求和数据异步传输至接收模块,同时产生发送响应信号;接收模块受接收端时钟驱动,通过寄存器打拍的方式同步接收请求信号,并在同步后的请求信号发生边沿跳变时采集有效数据,同时产生接收响应信号。本发明在避免跨时钟域数据传递亚稳态影响的前提下提高了数据传输效率,为人工智能芯片的大规模集成提供了良好的解决方案。
-
公开(公告)号:CN113869507B
公开(公告)日:2022-04-15
申请号:CN202111456203.8
申请日:2021-12-02
摘要: 本发明公开了一种基于脉动阵列的神经网络加速器卷积计算装置与方法,该装置的结构由64×64个同构的PE单元构成,组成脉动阵列的形式,包括多个权重输入通道,数据输入通道以及相应的数据(权重)选通有效信号。脉动阵列首行使能开始后,使能信号开始有效,所有数据计算完毕后,使能信号关闭。脉动阵列中权重数据由上往下传递,每个PE单元的计算结果和权重有效信号经过一级寄存器后输入到同一列的下一个PE单元中参与计算。脉动阵列中特征图数据和数据有效信号从左往右传递,经过一级寄存器后输入到一行的下一个PE单元中参与计算。
-
公开(公告)号:CN113870273B
公开(公告)日:2022-03-25
申请号:CN202111456202.3
申请日:2021-12-02
摘要: 本发明公开了一种基于脉动阵列的神经网络加速器特征图分割方法,包括:获取输入特征图、卷积核矩阵、卷积步长;根据滤波器维度和卷积步长,计算图像拆分步长;根据图像的拆分步长,计算当前子图像所在的行和列起始位置以及下一个子图像所在的行和列起始位置;若下一次拆分子图像行列数小于初始拆分子图像行列数,说明下一张拆分子图像已到最后侧,此时计算两者之差,得到行列数;若下一张拆分子图像行列数小于滤波器的行列数,则已不满足一次卷积计算,将其舍弃;将拆分特征图得到的子图像数据输入到脉动阵列中进行卷积运算。从而提高了数据利用率,同时减小卷积计算时间,提升效率。
-
公开(公告)号:CN115022628B
公开(公告)日:2022-12-13
申请号:CN202210930753.7
申请日:2022-08-04
IPC分类号: H04N19/103 , H04N19/91 , H04N19/93
摘要: 本发明公开一种基于JPEG‑LS的高吞吐率无损图像压缩方法,包括:步骤一,访问图像存储器并读取图像,构建读取图像的待编码像素的因果模板;步骤二,计算待编码像素的邻近图像像素间的局部梯度值,若局部梯度值的绝对值小于等于近无损度,则对待编码像素进行游程编码,否则对局部梯度值进行量化、符号校正和合并后进行常规编码;步骤三,经步骤二的编码后输出编码码流,完成对读取图像的压缩编码,若未完成所述读取图像的压缩编码,则返回步骤一重新进行压缩编码。本发明可降低硬件实现复杂度,有效提高该图像压缩算法的时钟频率以及吞吐率。
-
公开(公告)号:CN115168281A
公开(公告)日:2022-10-11
申请号:CN202211098597.9
申请日:2022-09-09
IPC分类号: G06F15/173 , G06N3/04 , G06N3/08
摘要: 本发明涉及计算机高性能计算领域,尤其涉及一种基于禁忌搜索算法的神经网络片上映射方法和装置,该方法构造禁忌搜索表并使用基于启发式的迭代搜索过程,选取局部的片上网络的计算核心作为候选对象,建立整数规划模型并求解最优解,循环迭代不断降低映射解的目标代价函数,最后获得近似最优的部署方案;本发明方法给出的基于最近邻的构造策略和禁忌搜索算法的搜索策略,降低了神经网络模型映射后的目标机器的整体功耗和通信距离总和,极大提高了数据在片上网络的传输效率及整体计算速度。
-
-
-
-
-
-
-
-
-