面向静态XY路由算法的二维网格NoC路由器优化设计方法

    公开(公告)号:CN101808032A

    公开(公告)日:2010-08-18

    申请号:CN201010118584.4

    申请日:2010-03-04

    Abstract: 本发明公开了一种面向静态XY路由算法的二维网格片上网络路由器优化设计方法,该方法分别对路由器的输入和输出通道进行优化设计,并根据路由器在网格中的不同位置,对其进行异构设计。在输入通道中,由于静态XY路由算法中南、北方向的输入通道不向东、西方向的输出通道发出请求,且任一输入通道都不产生回传请求,因此对各输入通道中的路由逻辑分别进行简化。在输出通道中,东、西方向输出通道只需处理2个输入通道的请求,而其余通道也只需处理4个输入请求。对于二维网格结构的NoC,位于网格边缘和拐角的路由器分别只需4对和3对输入、输出通道。本发明可以有效提高片上网络路由器的最大工作频率,减小其硬件开销,有着良好的应用价值。

    面向静态XY路由算法的二维网格NoC路由器优化设计方法

    公开(公告)号:CN101808032B

    公开(公告)日:2012-07-25

    申请号:CN201010118584.4

    申请日:2010-03-04

    Abstract: 本发明公开了一种面向静态XY路由算法的二维网格片上网络路由器优化设计方法,该方法分别对路由器的输入和输出通道进行优化设计,并根据路由器在网格中的不同位置,对其进行异构设计。在输入通道中,由于静态XY路由算法中南、北方向的输入通道不向东、西方向的输出通道发出请求,且任一输入通道都不产生回传请求,因此对各输入通道中的路由逻辑分别进行简化。在输出通道中,东、西方向输出通道只需处理2个输入通道的请求,而其余通道也只需处理4个输入请求。对于二维网格结构的NoC,位于网格边缘和拐角的路由器分别只需4对和3对输入、输出通道。本发明可以有效提高片上网络路由器的最大工作频率,减小其硬件开销,有着良好的应用价值。

    一种基于神经网络的手写英文文本识别方法

    公开(公告)号:CN114708602B

    公开(公告)日:2025-04-25

    申请号:CN202210437836.2

    申请日:2022-04-25

    Applicant: 南京大学

    Abstract: 本发明提供一种基于神经网络的手写英文文本识别方法,具体包括:获取数据集并训练得到字母识别母模型与字母识别子模型;训练得到语法判断模型;构建词典模块;利用字母识别母模型以及单词提取算法得到初次识别结果;利用词典模块判断测试图片中单词是否全部存在;将不存在的单词利用字母识别子模型识别得到其它识别结果;利用词典模块和语法判断模型对其他识别结果进行分类;对所有识别结果进行优先级排序。本发明在保留YOLO中的NMS非极大值抑制算法的同时,可输出多种可能识别结果,同时应用新的单词提取算法实现了对识别结果中单词的划分,为手写英文文本识别任务提供了一种新方法,大大提高了识别的准确性和灵活性。

    一种离散高斯噪声的并行生成方法及硬件结构

    公开(公告)号:CN113986196B

    公开(公告)日:2025-03-25

    申请号:CN202111240344.6

    申请日:2021-10-25

    Applicant: 南京大学

    Abstract: 本发明提供了一种离散高斯噪声的并行生成方法及硬件结构,属于密码学算法硬件设计领域,包括:真随机数缓冲区、随机比特寄存器、比特搜索模块、结果输出处理模块、控制状态机、结果缓冲区。本发明的提出了一种基于Knuth‑Yao算法的离散高斯噪声的生成方法及硬件结构,可以生成格密码学中所需要的离散高斯噪声。本发明在保证噪声分布的密码学安全性的同时,降低了采样时延,提高了并行度,并减少了查找的空间复杂度,提高了格密码算法的运行效率。

    一种基于Cholesky分解的迭代计算矩阵求逆方法及系统

    公开(公告)号:CN119441699A

    公开(公告)日:2025-02-14

    申请号:CN202411555384.3

    申请日:2024-11-04

    Applicant: 南京大学

    Abstract: 本申请公开了一种基于Cholesky分解的迭代计算矩阵求逆方法及系统,涉及DSP系统优化技术领域,该方法包括获取目标源矩阵;基于Cholesky分解,对目标源矩阵进行第一迭代处理,生成上三角矩阵;对上三角矩阵进行第二迭代处理,生成上三角矩阵的逆矩阵;对上三角矩阵的逆矩阵进行共轭转置处理,生成下三角矩阵;其中,下三角矩阵以整列存储的形式进行存放;将上三角矩阵的逆矩阵的存放方式转换为顺序存储的形式;对上三角矩阵的逆矩阵以及下三角矩阵进行矩阵乘法处理,生成目标源矩阵的逆矩阵。本申请通过迭代替代累加求和,采用复数乘加优化计算,支持多并行度操作,并行化处理补零操作,可适配一般矩阵乘法模块,降低计算时间和面积开销。

    一种三维可重构硬件加速核芯片
    9.
    发明公开

    公开(公告)号:CN119441130A

    公开(公告)日:2025-02-14

    申请号:CN202411555385.8

    申请日:2024-11-04

    Applicant: 南京大学

    Abstract: 本发明公开了一种三维可重构硬件加速核芯片,属于芯片技术领域,其技术方案要点是三维可重构硬件加速核芯片包括:可重构运算阵列用于提供至少一个单元级计算单元和至少一个算法级计算单元;存储阵列用于存储经AXI总线输入与可重构运算阵列输出的运算数据;控制器集合用于控制至少一个单元级计算单元和至少一个算法级计算单元,以分别实现单元级计算操作和算法级计算操作,以及控制存储阵列的运算数据存储,本发明通过独立的控制体系管理配置译码、重构控制、计算控制、数据分发与存储控制等调度功能,构建了基于静态调度、静态数据流模型的三维可重构硬件加速核芯片,该芯片通过存算解耦,实现了空间维度、时间维度、资源维度的多维可重构。

    一种数据搬运方法、DMA资源控制器、SOC系统和终端设备

    公开(公告)号:CN119441090A

    公开(公告)日:2025-02-14

    申请号:CN202411555392.8

    申请日:2024-11-04

    Applicant: 南京大学

    Abstract: 本发明公开了一种数据搬运方法、DMA资源控制器、SOC系统和终端设备,属于芯片技术领域,其技术方案要点是数据搬运方法,包括,根据第一存储器中当前待搬运的数据的数据传输类型,确定当前待搬运数据的数据搬运模式;基于数据搬运模式将当前待搬运数据搬运至第二存储器,其中所述第一存储器和所述第二存储器中的一个为DMA模块,本发明根据当前待搬运的数据的数据传输类型和算法设计了数据搬运模式,使所有类型的源数据和结果数据都可使用本发明提供的数据搬运模式实现数据传输。

Patent Agency Ranking