-
公开(公告)号:CN108762719A
公开(公告)日:2018-11-06
申请号:CN201810497969.2
申请日:2018-05-21
申请人: 南京大学
CPC分类号: G06F12/0646 , G06F7/483 , G06F15/7867
摘要: 本发明的并行广义内积重构控制器,包括:中间结果计算模块,接收源数据并根据源数据计算中间结果向量,生成向量的地址,存入bank;每完成一个中间结果向量的计算生成一个完成信号,并将所述完成信号发送至最终结果计算模块,作为启动信号;最终结果计算模块,读数据进入复数乘累加器进行最终结果计算得到结果矩阵第L个元素,生成向量的地址,存入bank;数据存储地址处理模块,根据乒乓操作选择信号进行数据选择,生成正确的bank地址信号。有益效果:计算时间少且存储资源利用率大,可满足在许多信号检测应用场景中进行非均匀检测时,获取检验统计量的高实时性要求。
-
公开(公告)号:CN108710944A
公开(公告)日:2018-10-26
申请号:CN201810412916.6
申请日:2018-04-30
申请人: 南京大学
CPC分类号: G06N3/08 , G06N3/0481
摘要: 本发明的生成可训练的分段式线性激活函数的方法,用于简化硬件加速过程中复杂的非线性激活函数的计算问题。该发明利用分段式的线性函数对非线性的激活函数进行替代,通过自身学习的办法不断更新系数,以达到利用线性函数替代非线性激活函数的目的。相比一般的线性激活函数而言,本方法更为接近原本非线性激活函数,相对误差较小,并在不断的逆向传播中更新系数,加快了学习的收敛速度,并在一定范围内尽可能的消除了梯度爆炸和梯度消失的问题。
-
公开(公告)号:CN108710505A
公开(公告)日:2018-10-26
申请号:CN201810480883.9
申请日:2018-05-18
申请人: 南京大学
IPC分类号: G06F9/30
CPC分类号: G06F9/30036
摘要: 本发明提供了一种基于FPGA的稀疏矩阵向量乘处理器,包括:预处理控制器模块,用于调度和冒险检测,使存储单元向运算单元阵列保持连续的数据流;运算模块,为多个计算单元组成计算单元阵列,通过单精度浮点乘法、加法器,实现单精度浮点稀疏矩阵向量乘运算;存储控制器模块,控制对片外DRAM中数据的读写。有益效果:所述处理器可以对存储带宽和运算资源进行扩展,有效提高了处理器的运算效率和通用性。
-
公开(公告)号:CN108683535A
公开(公告)日:2018-10-19
申请号:CN201810480022.0
申请日:2018-05-18
申请人: 南京大学
CPC分类号: H04L41/0631 , G06N3/049 , G06N5/04
摘要: 本发明涉及一种基于机器学习的高速数据分配模块故障诊断系统,包括:人机交互界面,直观地将当前网络系统的运行状态、故障诊断信息以及应对措施呈现给用户;综合数据库,存储网络系统中的所有运行数据、历史数据以及配置信息;推理机,将综合数据库中的相应信息数据与知识库中的规则集进行逻辑判断,并得出对应的网络故障诊断结果和解决方案;知识获取模块,制定动态规则集,所述动态规则集由大量历史诊断数据采用深度神经网络进行不断训练形成;知识库,存储初始规则集与所述动态规则集。本发明加入了使用DNN对历史故障诊断数据进行学习训练的方法,得到新的更加有效的规则集,能够很好的提高数据分配模块自动故障诊断系统的准确性和可靠性。
-
公开(公告)号:CN105701068B
公开(公告)日:2018-06-19
申请号:CN201610094119.9
申请日:2016-02-19
申请人: 南京大学
IPC分类号: G06F17/16
摘要: 本发明公开了一种基于分时复用技术的cholesky矩阵求逆系统,降低了在雷达信号处理中对共轭对称矩阵求逆所使用的硬件资源,同时通过提高矩阵求逆运算的并行度来保证运算速度。本发明根据公式A=L*D*LH,通过主控状态机将cholesky分解矩阵求逆划为三个步骤进行,分别是cholesky分解、上三角矩阵求逆和矩阵相乘。在主控状态机的控制下,通过复选器,分时复用运算资源和存储资源。该技术方案是基于单端口存储器和单精度浮点复数运算单元的并行流水处理,并支持任意阶数的共轭对称矩阵求逆,有效加快了运算速度,提高了硬件利用率,且具有良好的兼容性。
-
公开(公告)号:CN104833377B
公开(公告)日:2017-12-08
申请号:CN201510263525.9
申请日:2015-05-21
申请人: 南京大学
IPC分类号: G01D5/12
摘要: 本发明涉及一种高灵敏度水平霍尔盘,包括霍尔阱,用于在磁场和电场中通过霍尔效应产生电荷的载体;电极,分别与霍尔阱连接,用于输入偏置电压,输出霍尔电压;底层衬底,设于霍尔阱的底部,用于与十字霍尔阱产生反向偏置PN结,从而产生用于隔离霍尔阱的耗尽区,避免漏电;有源接地环,用于向霍尔盘提供相对电势零点;内侧和外侧保护环,包绕在霍尔阱的周侧,用于隔离霍尔阱,避免漏电流,屏蔽外部干扰;顶层金属层,设于霍尔阱的顶部,用于隔离霍尔阱,屏蔽外部干扰,降低霍尔盘工作时产生的闪烁噪声。有益效果为:不仅具有高灵敏度和低温度效应等特性,同时还具有体积小、结构简单、工艺兼容性好、加工成品率高等优势。
-
公开(公告)号:CN107248883A
公开(公告)日:2017-10-13
申请号:CN201710292659.2
申请日:2017-04-28
申请人: 南京大学
IPC分类号: H04B10/079
CPC分类号: H04B10/0795
摘要: 本发明涉及一种面向高吞吐量负载平衡硬件的实时监测系统,包括:光纤数据接收模块,通过FIFO接收来自光口的下行光纤数据;随帧监测信息采集模块,对光纤数据接收模块接收的每一帧数据进行监测,并监测数据处理模块是否正常工作,输出所述监测信息;数据处理模块,完成光纤数据的接收,按照工作模式选择,将光纤数据进行合并,将合并后的数据写入DDR读写模块;DDR读写模块,完成光纤数据的有效帧和所述监测信息的存储和读出;数据分配模块,将DDR读写模块存储的数据和所述监测信息按帧读出;数据发送模块,模块根据ID号选择处理簇并将光纤数据输出。有意效果:通过对资源的合理配置,实现了高吞吐量实时数字信号处理系统中负载平衡的实时监测方法,节省了芯片的面积,同时满足系统实时性和稳定性的要求。
-
公开(公告)号:CN106951211A
公开(公告)日:2017-07-14
申请号:CN201710189006.1
申请日:2017-03-27
申请人: 南京大学
IPC分类号: G06F7/523
摘要: 本发明提供了一种定浮点通用乘法器,既可以实现24位的定点乘法运算,也可以实现32位的单精度浮点乘法运算。所述乘法器将定点乘法器与主体结构相分离,由24位定点乘法器重构为单精度浮点乘法器。24位定点乘法器由4个12位乘法器组成,其中每个12位乘法器采用BOOTH算法,通过乘累加的紧缩结构完成运算,有效地提高了乘法运算效率和减少了运算资源开销。所述乘法器除了24位定点乘法器外不额外占用太多资源,在保证运算精度和数据吞吐率的情况下,有效地提高了乘法器的通用性。
-
公开(公告)号:CN106384708A
公开(公告)日:2017-02-08
申请号:CN201610835042.6
申请日:2016-09-19
申请人: 南京大学
CPC分类号: H01L21/02164 , B82Y30/00 , H01L21/02274 , H01L21/02381 , H01L21/02532 , H01L21/0257 , H01L21/02592 , H01L21/0262 , H01L21/02667
摘要: 利用硼磷共掺技术提高纳米硅基薄膜中磷的掺杂浓度效率的方法,步骤如下:1)利用PECVD制备掺杂纳米硅/二氧化硅多层膜材料;2)通过交替进行非晶硅层沉积/原位氧化两个过程,能够获得掺杂纳米硅/二氧化硅(a-Si/SiO2)多层膜材料;控制非晶硅层沉积/原位氧化的时获得a-Si/SiO2多层膜的厚度;3)对制备的a-Si/SiO2多层膜进行脱氢处理;4)脱氢后对进行氮气氛围下的高温退火处理,使多晶硅结晶形成纳米硅,并激活杂质原子进入纳米硅内部,实现纳米硅的掺杂;制备成共掺杂的纳米硅/二氧化硅多层膜。
-
公开(公告)号:CN105955896A
公开(公告)日:2016-09-21
申请号:CN201610272042.X
申请日:2016-04-27
申请人: 南京大学
摘要: 本发明涉及可重构DBF算法硬件加速器及控制方法,所述加速器包括重构控制模块,接收上位机发出的DBF算法信息数据,并根据DBF算法信息决定是否发出重构控制信号;数据存储模块,用于完成对DBF算法信息数据的写入,存储和读出;DBF运算模块,从数据存储模块读取数据,完成DBF算法的运算并输出相应结果。有益效果为:解决了专用DBF处理器通用性差和通用处理器计算DBF速度慢的矛盾,可重构架构可以提升算法的灵活性,并且实现了源数据的全流水输出,提高了算法的运算效率和实时性。
-
-
-
-
-
-
-
-
-