-
公开(公告)号:CN112231626B
公开(公告)日:2024-08-30
申请号:CN202011117587.6
申请日:2020-10-19
申请人: 南京宁麒智能计算芯片研究院有限公司
IPC分类号: G06F17/14
摘要: 本发明公开一种FFT处理器,属于数字信号处理技术领域。针对现有技术中存在的流水型架构硬件实现的FFT算法资源消耗大,递归型架构性能不高,现有技术无法解决FFT算法硬件实现性能和功耗同时满足的问题,本发明提供一种FFT处理器,包括顶层控制模块、数据索引模块、旋转因子索引模块和蝶形运算单元模块,顶层控制模块控制运算,数据索引模块对数据SRAM进行寻址,旋转因子索引模块对旋转因子SRAM进行寻址,蝶形运算单元模块根据顶层控制模块的信息重构运算单元进行蝶形运算,该处理器能够支持FFT/IFFT批处理运算,与传统FFT处理器相比,提高硬件资源的利用率,在保证高性能的基础上兼具低功耗的特点。
-
公开(公告)号:CN111401533A
公开(公告)日:2020-07-10
申请号:CN202010350549.9
申请日:2020-04-28
申请人: 南京宁麒智能计算芯片研究院有限公司
摘要: 本发明公开了一种神经网络专用计算阵列及其计算方法,属于算法硬件加速技术领域。本发明的计算阵列包括若干个可重构簇,每个可重构簇包括乘累加部件、加法部件、激活函数部件、乘法部件和比较器,加法部件和激活函数部件分别与乘法部件电性连接。且加法部件和激活函数部件分别与乘累加部件电性连接。本发明的方法为将重构指令字和原始数据输入至可重构簇的输入端口,之后可重构簇根据重构指令字形成数据通路,再根据数据通路对原始数据进行处理得到处理结果并输出。本发明的目的在于克服现有技术中,通常的计算阵列只适用于单一的神经网络计算的不足,本发明可以适用于多种神经网络的计算,提高了硬件资源的利用率及可复用性。
-
公开(公告)号:CN112232486A
公开(公告)日:2021-01-15
申请号:CN202011117592.7
申请日:2020-10-19
申请人: 南京宁麒智能计算芯片研究院有限公司
摘要: 本发明公开了一种YOLO脉冲神经网络的优化方法,属于神经网络技术领域。本发明的方法构建YOLO人工神经网络,并对YOLO人工神经网络的网络结构进行解析;再对解析后的YOLO人工神经网络进行动态标准化处理得到标准化YOLO人工神经网络;而后将标准化YOLO人工神经网络转换为YOLO脉冲神经网络,具体地,对标准化的YOLO人工神经网络建立脉冲输入输出机制、脉冲发射机制和膜电位复位机制得到YOLO脉冲神经网络。本发明克服了现有技术中YOLO脉冲神经网络精度较低的问题,本发明通过对YOLO人工神经网络进行解析、标准化和转换操作,得到的YOLO脉冲神经网络具有较高精度,从而可以提高YOLO脉冲神经网络的图像识别精度。
-
公开(公告)号:CN111582507A
公开(公告)日:2020-08-25
申请号:CN202010565715.7
申请日:2020-06-19
申请人: 南京宁麒智能计算芯片研究院有限公司
摘要: 本发明公开一种基于SIMD架构的LS-SVM训练机的硬件系统及训练方法,属于机器学习算法的硬件实现技术领域。针对现有技术中LS-SVM实现方式受限于资源、训练速度慢或计算量大的问题,本发明提供一种基于SIMD架构的LS-SVM训练机的硬件系统,包括主控制模块,乘累加模块,更新值计算模块,更新及阈值比较模块,计算阵列模块和存储资源模块;主控制模块控制训练过程的开始和结束;乘累加模块完成权值系数和训练参数的乘累加计算;更新值计算模块计算训练参数的更新值;更新及阈值比较模块完成训练参数的更新并统计小于阈值的更新值个数。本发明采用SIMD架构,实现并行计算和流水处理,加快了训练速度,并且有效地进行了资源复用。
-
公开(公告)号:CN112290956A
公开(公告)日:2021-01-29
申请号:CN202011117608.4
申请日:2020-10-19
申请人: 南京宁麒智能计算芯片研究院有限公司
IPC分类号: H03M13/27
摘要: 本发明公开一种基于流水线结构的CTC编码器及编码方法,属于无线通信技术领域。针对现有技术中存在的现有技术编码消耗的时钟周期较长,编码效率低,消耗资源过大的问题,本发明提供一种基于流水线结构的CTC编码器及编码方法,采用流水线结构的子编码器,在原信息序列的编码的同时进行内交织序列的预编码,减小编码运算周期,复用序列子交织单元以实现原信息序列编码的子交织和内交织序列编码的子交织,通过外部输入序列内交织地址和序列子交织地址进行算法中的内交织和子交织操作,减少所述CTC编码器的内部复杂计算,提高系统的性能、灵活性,并降低硬件开销,有着良好的实际应用价值,适合硬件实现。
-
公开(公告)号:CN111860792A
公开(公告)日:2020-10-30
申请号:CN202010893482.3
申请日:2020-08-31
申请人: 南京宁麒智能计算芯片研究院有限公司
摘要: 本发明公开一种激活函数的硬件实现装置和方法,属于函数计算的硬件实现技术领域。针对现有技术中存在的传统方法硬件实现激活函数时很难平衡高性能与硬件资源的问题,包括e指数计算模块和CORDIC除法模块,输入信号在e指数计算模块通过以2为底的小型指数查找表及移位、加法运算计算出e指数e-x或e指数e2x,本发明的加法器基于进位保留加法,实现形如“I1+I2-I3”的计算功能;CORDIC除法模块基于CORDIC算法,通过多次迭代计算出形如 的除法函数结果。本发明电路结构简洁、无复杂控制逻辑,电路布局布线方便,计算精度高,计算时支持任意输入范围的sigmoid和tanh激活函数计算,解决传统硬件实现方法无法平衡性能与硬件资源的问题。
-
公开(公告)号:CN111401533B
公开(公告)日:2024-09-27
申请号:CN202010350549.9
申请日:2020-04-28
申请人: 南京宁麒智能计算芯片研究院有限公司
IPC分类号: G06N3/063 , G06N3/0442 , G06N5/04 , G06N3/048
摘要: 本发明公开了一种神经网络专用计算阵列及其计算方法,属于算法硬件加速技术领域。本发明的计算阵列包括若干个可重构簇,每个可重构簇包括乘累加部件、加法部件、激活函数部件、乘法部件和比较器,加法部件和激活函数部件分别与乘法部件电性连接。且加法部件和激活函数部件分别与乘累加部件电性连接。本发明的方法为将重构指令字和原始数据输入至可重构簇的输入端口,之后可重构簇根据重构指令字形成数据通路,再根据数据通路对原始数据进行处理得到处理结果并输出。本发明的目的在于克服现有技术中,通常的计算阵列只适用于单一的神经网络计算的不足,本发明可以适用于多种神经网络的计算,提高了硬件资源的利用率及可复用性。
-
公开(公告)号:CN112231626A
公开(公告)日:2021-01-15
申请号:CN202011117587.6
申请日:2020-10-19
申请人: 南京宁麒智能计算芯片研究院有限公司
IPC分类号: G06F17/14
摘要: 本发明公开一种FFT处理器,属于数字信号处理技术领域。针对现有技术中存在的流水型架构硬件实现的FFT算法资源消耗大,递归型架构性能不高,现有技术无法解决FFT算法硬件实现性能和功耗同时满足的问题,本发明提供一种FFT处理器,包括顶层控制模块、数据索引模块、旋转因子索引模块和蝶形运算单元模块,顶层控制模块控制运算,数据索引模块对数据SRAM进行寻址,旋转因子索引模块对旋转因子SRAM进行寻址,蝶形运算单元模块根据顶层控制模块的信息重构运算单元进行蝶形运算,该处理器能够支持FFT/IFFT批处理运算,与传统FFT处理器相比,提高硬件资源的利用率,在保证高性能的基础上兼具低功耗的特点。
-
公开(公告)号:CN212569855U
公开(公告)日:2021-02-19
申请号:CN202021864854.1
申请日:2020-08-31
申请人: 南京宁麒智能计算芯片研究院有限公司
摘要: 本实用新型公开一种激活函数的硬件实现装置,属于函数计算的硬件实现技术领域。针对现有技术中存在的传统方法硬件实现激活函数时很难平衡高性能与硬件资源的问题,包括e指数计算模块和CORDIC除法模块,输入信号在e指数计算模块通过以2为底的小型指数查找表及移位、加法运算计算出e指数e‑x或e指数e2x,本实用新型的加法器基于进位保留加法,实现形如“I1+I2‑I3”的计算功能;CORDIC除法模块基于CORDIC算法,通过多次迭代计算出形如 的除法函数结果。本实用新型电路结构简洁、无复杂控制逻辑,电路布局布线方便,计算精度高,计算时支持任意输入范围的sigmoid和tanh激活函数计算,解决传统硬件实现无法平衡性能与硬件资源的问题。(ESM)同样的发明创造已同日申请发明专利
-
公开(公告)号:CN211577939U
公开(公告)日:2020-09-25
申请号:CN202020682997.4
申请日:2020-04-28
申请人: 南京宁麒智能计算芯片研究院有限公司
摘要: 本实用新型公开了一种神经网络专用计算阵列,属于算法硬件加速技术领域。本实用新型的计算阵列包括若干个可重构簇,每个可重构簇包括乘累加部件、加法部件、激活函数部件、乘法部件和比较器,加法部件和激活函数部件分别与乘法部件电性连接。且加法部件和激活函数部件分别与乘累加部件电性连接。本实用新型的目的在于克服现有技术中,通常的计算阵列只适用于单一的神经网络计算,且不能实现神经网络算法中的并行性计算的不足,提供了一种神经网络专用计算阵列,可以适用于多种神经网络的计算,提高了硬件资源的利用率及可复用性;进一步可以实现神经网络算法中的并行化计算,提高了算法的运算效率。(ESM)同样的发明创造已同日申请发明专利
-
-
-
-
-
-
-
-
-