基于CORDIC算法的复对数实现方法、装置、设备及计算机存储介质

    公开(公告)号:CN113127802B

    公开(公告)日:2023-08-08

    申请号:CN202110459595.7

    申请日:2021-04-27

    Applicant: 南京大学

    Abstract: 本发明首次提出了一种基于CORDIC算法的复对数实现方法、装置、设备及计算机存储介质,主要利用圆周向量模块(VC‑CORDIC),双曲向量模块(VH‑CORDIC)进行联级操作。首先,将所需计算目标的实部和虚部输入圆周向量模块(VC‑CORDIC)进行迭代计算,VC‑CORDIC模块得出所求结果的虚部以及实部中间值;然后将实部中间值的相邻值作为VH‑CORDIC模块的输入进行迭代计算,得出的结果经过减法和移位操作之后得到所求结果的实部,进一步减少了计算的复杂度,相比于传统的查找表、线性近似的方法,本发明具有精度高、面积小、功耗低的特点。

    基于CORDIC算法的复对数实现方法、装置、设备及计算机存储介质

    公开(公告)号:CN113127802A

    公开(公告)日:2021-07-16

    申请号:CN202110459595.7

    申请日:2021-04-27

    Applicant: 南京大学

    Abstract: 本发明首次提出了一种基于CORDIC算法的复对数实现方法、装置、设备及计算机存储介质,主要利用圆周向量模块(VC‑CORDIC),双曲向量模块(VH‑CORDIC)进行联级操作。首先,将所需计算目标的实部和虚部输入圆周向量模块(VC‑CORDIC)进行迭代计算,VC‑CORDIC模块得出所求结果的虚部以及实部中间值;然后将实部中间值的相邻值作为VH‑CORDIC模块的输入进行迭代计算,得出的结果经过减法和移位操作之后得到所求结果的实部,进一步减少了计算的复杂度,相比于传统的查找表、线性近似的方法,本发明具有精度高、面积小、功耗低的特点。

    一种可拼接、可分段的全连接神经网络推理加速器及其加速方法

    公开(公告)号:CN111860819B

    公开(公告)日:2023-11-07

    申请号:CN202010731785.5

    申请日:2020-07-27

    Applicant: 南京大学

    Abstract: 本发明涉及一种可拼接、可分段的全连接神经网络推理加速器及其加速方法,加速器包括控制模块、存储模块、计算模块三大功能模块,控制模块有三种模式:配置模式、搬运模式、计算模式。本发明充分利用全连接计算的可并行性以及权重的可共享性,支持多批处理、多路并行计算。控制模块通过模式的跳转来控制整个全连接的实现与加速。本发明可以实现对输入神经元和权重的独立地址的拼接,即可以将需要进行多次计算的全连接合并为一次全连接运算;其次,本发明可以实现全连接计算的拆分,通过暂存中间结果的方式对其进行分段计算,在硬件资源有限的情况下,实现大规模的全连接神经网络的计算。

    一种可拼接、可分段的全连接神经网络推理加速器及其加速方法

    公开(公告)号:CN111860819A

    公开(公告)日:2020-10-30

    申请号:CN202010731785.5

    申请日:2020-07-27

    Applicant: 南京大学

    Abstract: 本发明涉及一种可拼接、可分段的全连接神经网络推理加速器及其加速方法,加速器包括控制模块、存储模块、计算模块三大功能模块,控制模块有三种模式:配置模式、搬运模式、计算模式。本发明充分利用全连接计算的可并行性以及权重的可共享性,支持多批处理、多路并行计算。控制模块通过模式的跳转来控制整个全连接的实现与加速。本发明可以实现对输入神经元和权重的独立地址的拼接,即可以将需要进行多次计算的全连接合并为一次全连接运算;其次,本发明可以实现全连接计算的拆分,通过暂存中间结果的方式对其进行分段计算,在硬件资源有限的情况下,实现大规模的全连接神经网络的计算。

Patent Agency Ranking