-
公开(公告)号:CN113377332B
公开(公告)日:2023-08-22
申请号:CN202110591328.5
申请日:2021-05-28
Applicant: 南京大学
Abstract: 本发明提出了一种基于线性分段的softmax硬件实现方法,该方法实现的电路系统包括:控制器用于实现softmax运算所需的源数据的读取和分发,以及运算结果的存储;排序模块用于将输入进行排序,并找出最大值;自然指数模块用于计算输入源数据的e指数函数值;加法树模块用于将e指数模块的结果进行累加;除法模块用于计算每个e指数计算结果与累加结果的比值。该方法实现的电路系统通过分解计算过程、压缩计算区间,大幅降低了传统查找表方法实现softmax的参数,兼具了高性能和低硬件资源开销,可用于各种人工智能算法加速场景。
-
公开(公告)号:CN110232441B
公开(公告)日:2023-05-09
申请号:CN201910528794.1
申请日:2019-06-18
Applicant: 南京大学
IPC: G06N3/063
Abstract: 本发明的基于单向脉动阵列的堆栈式自编码算法推理的硬件实现,包括信号控制模块、输入输出控制模块、数据地址产生模块和计算阵列模块;信号控制模块:接收开始信号,控制各模块间通信,产生结束信号;输入输出控制模块:输入时读取片外DDR的数据并按特定方式存入片内SRAM,输出时将片内SRAM数据按特定方式写回DDR;数据地址产生模块:生成源数据或结果数据地址;计算阵列模块:以单向脉动阵列的方式进行神经网络算法的推理运算。本发明支持批处理,支持流水操作,通过乒乓操作实现部分计算时间和访存时间的隐藏,加速比高,可扩展性好。
-
公开(公告)号:CN116054750A
公开(公告)日:2023-05-02
申请号:CN202211733383.4
申请日:2022-12-30
Applicant: 南京大学
Abstract: 本发明公开了一种宽范围的失调消除可编程程控放大器,包括放大器本体、单位电阻、电阻阵列和失调消除单元:放大器本体具有正输入端、负输入端、正输出端和负输出端;单位电阻设置于放大器本体的正输入端和负输入端;电阻阵列分别连接与放大器本体的正输入端与负输出端之间,和/或连接于放大器本体的负输入端和正输出端之间;失调消除单元包括两端分别连接于正输出端和负输出端的比较器、两端分别连接于正输入端和负输入端的电流开关网络,以及分别与比较器和电流开关网络一端连接的数字逻辑单元。本发明在有效控制面积的情况下,通过较为简洁的方法实现了宽范围的功能,并且通过新的数字方法,在较短时间内完成失调消除的功能。
-
公开(公告)号:CN110058841B
公开(公告)日:2023-03-28
申请号:CN201910321975.7
申请日:2019-04-22
Applicant: 南京大学
IPC: G06F7/544
Abstract: 本发明提供了一种面向具有对称性的非线性函数的通用计算装置和方法。计算装置包括取绝对值单元、地址索引单元、查找表单元、乘加单元、取符号位单元、减法器和选择器。其中,地址索引单元包括比较器、控制器、地址寄存器和分段端点存储器。本发明提供的面向具有对称性的非线性函数计算装置,可以计算任意具有轴对称或中心对称的非线性函数值,具有一定的通用性。同时本发明根据目标分段线性函数与原始非线性函数的最大绝对误差对原始非线性函数进行分段处理,可实现近似计算结果的精度可控。
-
公开(公告)号:CN115776367A
公开(公告)日:2023-03-10
申请号:CN202211356621.4
申请日:2022-11-01
Applicant: 南京大学
Abstract: 本发明公开了一种模乘精简的同态加密神经网络线性层硬件加速方法及系统,该方法包括:用户端接收输入的神经网络模型的权重数据,并采用加法二次幂方法进行量化,然后进行重排和转置;用户端接收输入的神经网络模型的源数据,并采用img2col的方式进行重排,然后进行转置,并编码为明文多项式;用户端将编码后的明文多项式加密为同态加密方案对应的密文,并与处理后的权重数据一起发送到硬件加速器;硬件加速器对密文和权重数据开启同态加密条件下的神经网络线性层运算,并将运算结果反馈到用户端。本发明减小了模乘运算器的计算周期和资源开销,提升了计算效率。
-
公开(公告)号:CN110749614B
公开(公告)日:2022-12-27
申请号:CN201911095589.7
申请日:2019-11-11
Applicant: 南京大学
IPC: G01N24/08
Abstract: 本发明涉及一种快速定量检测土壤中有机磷的方法,将土壤样品加入到0.25M NaOH和0.05M Na2EDTA的混合溶液中,避光振荡提取后离心,收集上清液并过滤,收集上清冷冻得到冻干粉;取50mg冻干粉,溶于2mL顺磁离子溶液中,涡旋后静置,得到液体31P NMR样品,使用Bruker 600MHz液体核磁共振波谱仪进行检测,通过图谱中31P信号的化学位移值,可确定该信号对应的有机磷形态,根据信号峰强度的相对比例,可确定对应某种或某类有机磷的相对丰度,从而计算其含量。与常用液体31P NMR方法相比,本发明缩短了NMR实验检测时间,提高了土壤有机磷定量分析的效率。
-
公开(公告)号:CN115495046A
公开(公告)日:2022-12-20
申请号:CN202210943023.0
申请日:2022-08-08
Applicant: 南京大学
Abstract: 本发明涉及基于分段二次多项式近似的单精度浮点数N次开根号计算架构、方法和系统,包括:log2分段二次多项式近似模块,通过分段二次多项式近似计算出以2为底、任意真数的对数函数结果;exp2分段二次多项式近似模块,通过分段二次多项式近似计算出以2为底、任意指数的指数函数结果;基本运算模块包括浮点转换单元、加法单元、查找表单元和乘法单元;控制模块通过调用各个模块和计算单元控制整体计算流程并输出结果。本发明可同时获得高精度、低延时、低资源占用率和低功耗的要求。
-
公开(公告)号:CN115374924A
公开(公告)日:2022-11-22
申请号:CN202211029242.4
申请日:2022-08-26
Applicant: 南京大学
Abstract: 本发明提供了一种基于三值脉冲的脉冲神经网络的优化方法及硬件加速器。步骤如下:在每个时间步长内设置一个采样窗口,在采样窗口内使用泊松分布生成与输入图像对应的二值脉冲序列;将采样窗口的每个二值脉冲序列累加,根据累加结果生成三值脉冲,将所有时间步长内的三值脉冲集合,生成与输入图像对应的三值脉冲序列;对神经元设置双膜阈值电压,根据双膜阈值电压,神经元输出相应的三值脉冲;前向传播结束后,使用梯度替代的反向传播算法更新权重;训练完成后,使用硬件加速器对训练好的网络进行推理。本方法显著提高了脉冲的信息携带能力,大大缩短了训练及推理所需的时间窗口长度,保持硬件控制逻辑简单的同时进一步增大了网络的吞吐率。
-
公开(公告)号:CN108536931B
公开(公告)日:2022-02-08
申请号:CN201810250929.8
申请日:2018-03-23
Applicant: 南京大学
IPC: G06F30/20
Abstract: 本发明公开了一种基于贪婪算法的三维片上网络中温度传感器的部署方法,该方法首先建立一个基于状态空间的三维片上网络的热模型,然后设定可观测性格拉姆矩阵的秩作为优化目标函数,最后采用贪婪算法,从温度传感器可选的位置集合V中选择一个大小为m的子集S用来部署温度传感器,该子集使得目标函数最大化。本发明可以在多项式时间内找到一个次优解,并保证满足一定的误差界。与传统方法相比,在存在测量噪声以及传感器数目有限的情况下,本发明结合卡尔曼滤波可以实现较高精度的全芯片温度重建。
-
公开(公告)号:CN113467590A
公开(公告)日:2021-10-01
申请号:CN202111035472.7
申请日:2021-09-06
Applicant: 南京大学
IPC: G06F1/20 , G06F15/173 , G06N3/08
Abstract: 本发明提出了一种基于相关性和人工神经网络的众核芯片温度重构方法及系统,该方法基于众核芯片核与核之间温度变化之间的相关性确定了热传感器的分布位置;人工神经网络能够根据热传感器获得的部分核的温度得出众核芯片中所有核的温度。本发明可以支持众核芯片在多种负载情况下进行温度重构;当众核芯片运行多种不同的应用的时候不需要重新确定热传感器的分配位置和也无需重新训练人工神经网络。本发明所需热传感器数目少,重构得到的温度精度高,能适应多种负载情况,因此有着良好的实用价值和广泛的应用前景。
-
-
-
-
-
-
-
-
-