-
公开(公告)号:CN104461465A
公开(公告)日:2015-03-25
申请号:CN201410833374.1
申请日:2014-12-29
Applicant: 南京大学 , 中国电子科技集团公司第十四研究所
Abstract: 本发明涉及一种基于乒乓操作的高效率控制器,与外部DSP核连接,包括外部接口模块,用于实现控制器与外部DSP之间的数据传递;主状态机模块,用于完成状态的跳转,通过将计算时间掩盖搬运数据的时间,实现乒乓功能;寄存器组,用于实现外部DSP与本控制器的信息交互;存储分配单元,用于完成内部存储的分配,为实现乒乓操作提供存储资源基础。有益效果为:将内部存储资源分为两部分,在前半部分运算时,搬运后半部分所需的数据,从而掩盖部分搬运数据的时间,实现乒乓操作流程,提高实际运算效率。
-
公开(公告)号:CN101808032A
公开(公告)日:2010-08-18
申请号:CN201010118584.4
申请日:2010-03-04
Applicant: 南京大学 , 中国电子科技集团公司第十四研究所
IPC: H04L12/56
Abstract: 本发明公开了一种面向静态XY路由算法的二维网格片上网络路由器优化设计方法,该方法分别对路由器的输入和输出通道进行优化设计,并根据路由器在网格中的不同位置,对其进行异构设计。在输入通道中,由于静态XY路由算法中南、北方向的输入通道不向东、西方向的输出通道发出请求,且任一输入通道都不产生回传请求,因此对各输入通道中的路由逻辑分别进行简化。在输出通道中,东、西方向输出通道只需处理2个输入通道的请求,而其余通道也只需处理4个输入请求。对于二维网格结构的NoC,位于网格边缘和拐角的路由器分别只需4对和3对输入、输出通道。本发明可以有效提高片上网络路由器的最大工作频率,减小其硬件开销,有着良好的应用价值。
-
公开(公告)号:CN104504205B
公开(公告)日:2017-09-15
申请号:CN201410827960.5
申请日:2014-12-29
Applicant: 南京大学 , 中国电子科技集团公司第十四研究所
IPC: G06F17/50
Abstract: 本发明涉及一种对称FIR算法的并行化二维分割方法,包括设定对称FIR算法的参数:源向量点数,滤波系数长度;2)采用支持四路并行运算的乘法器、加法器通过对称FIR算法处理源数据;3)根据源数据长度,采用不同的算法完成DMA搬运阶段。有益效果为:解决了DMA搬运阶段基于并行化设计的数据细粒度分割、数据存放问题,以及向量长度过大而内存容量受限,需要作多次DMA搬入、处理、搬出,由此带来的源数据粗粒度分割问题。
-
公开(公告)号:CN101808032B
公开(公告)日:2012-07-25
申请号:CN201010118584.4
申请日:2010-03-04
Applicant: 南京大学 , 中国电子科技集团公司第十四研究所
IPC: H04L12/56
Abstract: 本发明公开了一种面向静态XY路由算法的二维网格片上网络路由器优化设计方法,该方法分别对路由器的输入和输出通道进行优化设计,并根据路由器在网格中的不同位置,对其进行异构设计。在输入通道中,由于静态XY路由算法中南、北方向的输入通道不向东、西方向的输出通道发出请求,且任一输入通道都不产生回传请求,因此对各输入通道中的路由逻辑分别进行简化。在输出通道中,东、西方向输出通道只需处理2个输入通道的请求,而其余通道也只需处理4个输入请求。对于二维网格结构的NoC,位于网格边缘和拐角的路由器分别只需4对和3对输入、输出通道。本发明可以有效提高片上网络路由器的最大工作频率,减小其硬件开销,有着良好的应用价值。
-
公开(公告)号:CN104504205A
公开(公告)日:2015-04-08
申请号:CN201410827960.5
申请日:2014-12-29
Applicant: 南京大学 , 中国电子科技集团公司第十四研究所
IPC: G06F17/50
Abstract: 本发明涉及一种对称FIR算法的并行化二维分割方法,包括设定对称FIR算法的参数:源向量点数,滤波系数长度;2)采用支持四路并行运算的乘法器、加法器通过对称FIR算法处理源数据;3)根据源数据长度,采用不同的算法完成DMA搬运阶段。有益效果为:解决了DMA搬运阶段基于并行化设计的数据细粒度分割、数据存放问题,以及向量长度过大而内存容量受限,需要作多次DMA搬入、处理、搬出,由此带来的源数据粗粒度分割问题。
-
公开(公告)号:CN114708602B
公开(公告)日:2025-04-25
申请号:CN202210437836.2
申请日:2022-04-25
Applicant: 南京大学
IPC: G06V30/412 , G06N3/0464 , G06N3/049 , G06N3/08 , G06V10/774 , G06V10/82
Abstract: 本发明提供一种基于神经网络的手写英文文本识别方法,具体包括:获取数据集并训练得到字母识别母模型与字母识别子模型;训练得到语法判断模型;构建词典模块;利用字母识别母模型以及单词提取算法得到初次识别结果;利用词典模块判断测试图片中单词是否全部存在;将不存在的单词利用字母识别子模型识别得到其它识别结果;利用词典模块和语法判断模型对其他识别结果进行分类;对所有识别结果进行优先级排序。本发明在保留YOLO中的NMS非极大值抑制算法的同时,可输出多种可能识别结果,同时应用新的单词提取算法实现了对识别结果中单词的划分,为手写英文文本识别任务提供了一种新方法,大大提高了识别的准确性和灵活性。
-
公开(公告)号:CN113986196B
公开(公告)日:2025-03-25
申请号:CN202111240344.6
申请日:2021-10-25
Applicant: 南京大学
Abstract: 本发明提供了一种离散高斯噪声的并行生成方法及硬件结构,属于密码学算法硬件设计领域,包括:真随机数缓冲区、随机比特寄存器、比特搜索模块、结果输出处理模块、控制状态机、结果缓冲区。本发明的提出了一种基于Knuth‑Yao算法的离散高斯噪声的生成方法及硬件结构,可以生成格密码学中所需要的离散高斯噪声。本发明在保证噪声分布的密码学安全性的同时,降低了采样时延,提高了并行度,并减少了查找的空间复杂度,提高了格密码算法的运行效率。
-
公开(公告)号:CN119441699A
公开(公告)日:2025-02-14
申请号:CN202411555384.3
申请日:2024-11-04
Applicant: 南京大学
IPC: G06F17/16
Abstract: 本申请公开了一种基于Cholesky分解的迭代计算矩阵求逆方法及系统,涉及DSP系统优化技术领域,该方法包括获取目标源矩阵;基于Cholesky分解,对目标源矩阵进行第一迭代处理,生成上三角矩阵;对上三角矩阵进行第二迭代处理,生成上三角矩阵的逆矩阵;对上三角矩阵的逆矩阵进行共轭转置处理,生成下三角矩阵;其中,下三角矩阵以整列存储的形式进行存放;将上三角矩阵的逆矩阵的存放方式转换为顺序存储的形式;对上三角矩阵的逆矩阵以及下三角矩阵进行矩阵乘法处理,生成目标源矩阵的逆矩阵。本申请通过迭代替代累加求和,采用复数乘加优化计算,支持多并行度操作,并行化处理补零操作,可适配一般矩阵乘法模块,降低计算时间和面积开销。
-
公开(公告)号:CN119441130A
公开(公告)日:2025-02-14
申请号:CN202411555385.8
申请日:2024-11-04
Applicant: 南京大学
Abstract: 本发明公开了一种三维可重构硬件加速核芯片,属于芯片技术领域,其技术方案要点是三维可重构硬件加速核芯片包括:可重构运算阵列用于提供至少一个单元级计算单元和至少一个算法级计算单元;存储阵列用于存储经AXI总线输入与可重构运算阵列输出的运算数据;控制器集合用于控制至少一个单元级计算单元和至少一个算法级计算单元,以分别实现单元级计算操作和算法级计算操作,以及控制存储阵列的运算数据存储,本发明通过独立的控制体系管理配置译码、重构控制、计算控制、数据分发与存储控制等调度功能,构建了基于静态调度、静态数据流模型的三维可重构硬件加速核芯片,该芯片通过存算解耦,实现了空间维度、时间维度、资源维度的多维可重构。
-
公开(公告)号:CN119441090A
公开(公告)日:2025-02-14
申请号:CN202411555392.8
申请日:2024-11-04
Applicant: 南京大学
Abstract: 本发明公开了一种数据搬运方法、DMA资源控制器、SOC系统和终端设备,属于芯片技术领域,其技术方案要点是数据搬运方法,包括,根据第一存储器中当前待搬运的数据的数据传输类型,确定当前待搬运数据的数据搬运模式;基于数据搬运模式将当前待搬运数据搬运至第二存储器,其中所述第一存储器和所述第二存储器中的一个为DMA模块,本发明根据当前待搬运的数据的数据传输类型和算法设计了数据搬运模式,使所有类型的源数据和结果数据都可使用本发明提供的数据搬运模式实现数据传输。
-
-
-
-
-
-
-
-
-