一种基于神经网络的手写英文文本识别方法

    公开(公告)号:CN114708602B

    公开(公告)日:2025-04-25

    申请号:CN202210437836.2

    申请日:2022-04-25

    Applicant: 南京大学

    Abstract: 本发明提供一种基于神经网络的手写英文文本识别方法,具体包括:获取数据集并训练得到字母识别母模型与字母识别子模型;训练得到语法判断模型;构建词典模块;利用字母识别母模型以及单词提取算法得到初次识别结果;利用词典模块判断测试图片中单词是否全部存在;将不存在的单词利用字母识别子模型识别得到其它识别结果;利用词典模块和语法判断模型对其他识别结果进行分类;对所有识别结果进行优先级排序。本发明在保留YOLO中的NMS非极大值抑制算法的同时,可输出多种可能识别结果,同时应用新的单词提取算法实现了对识别结果中单词的划分,为手写英文文本识别任务提供了一种新方法,大大提高了识别的准确性和灵活性。

    一种离散高斯噪声的并行生成方法及硬件结构

    公开(公告)号:CN113986196B

    公开(公告)日:2025-03-25

    申请号:CN202111240344.6

    申请日:2021-10-25

    Applicant: 南京大学

    Abstract: 本发明提供了一种离散高斯噪声的并行生成方法及硬件结构,属于密码学算法硬件设计领域,包括:真随机数缓冲区、随机比特寄存器、比特搜索模块、结果输出处理模块、控制状态机、结果缓冲区。本发明的提出了一种基于Knuth‑Yao算法的离散高斯噪声的生成方法及硬件结构,可以生成格密码学中所需要的离散高斯噪声。本发明在保证噪声分布的密码学安全性的同时,降低了采样时延,提高了并行度,并减少了查找的空间复杂度,提高了格密码算法的运行效率。

    一种基于Cholesky分解的迭代计算矩阵求逆方法及系统

    公开(公告)号:CN119441699A

    公开(公告)日:2025-02-14

    申请号:CN202411555384.3

    申请日:2024-11-04

    Applicant: 南京大学

    Abstract: 本申请公开了一种基于Cholesky分解的迭代计算矩阵求逆方法及系统,涉及DSP系统优化技术领域,该方法包括获取目标源矩阵;基于Cholesky分解,对目标源矩阵进行第一迭代处理,生成上三角矩阵;对上三角矩阵进行第二迭代处理,生成上三角矩阵的逆矩阵;对上三角矩阵的逆矩阵进行共轭转置处理,生成下三角矩阵;其中,下三角矩阵以整列存储的形式进行存放;将上三角矩阵的逆矩阵的存放方式转换为顺序存储的形式;对上三角矩阵的逆矩阵以及下三角矩阵进行矩阵乘法处理,生成目标源矩阵的逆矩阵。本申请通过迭代替代累加求和,采用复数乘加优化计算,支持多并行度操作,并行化处理补零操作,可适配一般矩阵乘法模块,降低计算时间和面积开销。

    一种三维可重构硬件加速核芯片
    4.
    发明公开

    公开(公告)号:CN119441130A

    公开(公告)日:2025-02-14

    申请号:CN202411555385.8

    申请日:2024-11-04

    Applicant: 南京大学

    Abstract: 本发明公开了一种三维可重构硬件加速核芯片,属于芯片技术领域,其技术方案要点是三维可重构硬件加速核芯片包括:可重构运算阵列用于提供至少一个单元级计算单元和至少一个算法级计算单元;存储阵列用于存储经AXI总线输入与可重构运算阵列输出的运算数据;控制器集合用于控制至少一个单元级计算单元和至少一个算法级计算单元,以分别实现单元级计算操作和算法级计算操作,以及控制存储阵列的运算数据存储,本发明通过独立的控制体系管理配置译码、重构控制、计算控制、数据分发与存储控制等调度功能,构建了基于静态调度、静态数据流模型的三维可重构硬件加速核芯片,该芯片通过存算解耦,实现了空间维度、时间维度、资源维度的多维可重构。

    一种数据搬运方法、DMA资源控制器、SOC系统和终端设备

    公开(公告)号:CN119441090A

    公开(公告)日:2025-02-14

    申请号:CN202411555392.8

    申请日:2024-11-04

    Applicant: 南京大学

    Abstract: 本发明公开了一种数据搬运方法、DMA资源控制器、SOC系统和终端设备,属于芯片技术领域,其技术方案要点是数据搬运方法,包括,根据第一存储器中当前待搬运的数据的数据传输类型,确定当前待搬运数据的数据搬运模式;基于数据搬运模式将当前待搬运数据搬运至第二存储器,其中所述第一存储器和所述第二存储器中的一个为DMA模块,本发明根据当前待搬运的数据的数据传输类型和算法设计了数据搬运模式,使所有类型的源数据和结果数据都可使用本发明提供的数据搬运模式实现数据传输。

    一种多场景多算法适配的向量访存控制器实现方法

    公开(公告)号:CN119441086A

    公开(公告)日:2025-02-14

    申请号:CN202411555382.4

    申请日:2024-11-04

    Applicant: 南京大学

    Abstract: 本发明涉及向量处理器的技术领域,公开了一种多场景多算法适配的向量访存控制器实现方法,包括以下步骤:访存控制模块获取上位机的配置信号,确定数据读取模式与算法并行度,并生成访存控制信号;访存状态模块响应所述访存控制信号,生成读数控制指令与写数控制指令;源数据模块响应所述读数控制指令,从存储资源中读取源数据,并送入计算资源进行数据运算,得到结果数据;结果数据模块响应所述写数控制指令,从计算资源中获取结果数据并写入存储资源。本发明可根据算法并行度、数据批数、数据点数灵活进行算法实现方式的选择,从而在不同的应用场景或不同的数据维度下取得更好的向量访存性能。

    一种提高深度残差脉冲神经网络精度以优化图像分类的方法及其系统

    公开(公告)号:CN111860790B

    公开(公告)日:2024-11-22

    申请号:CN202010772308.3

    申请日:2020-08-04

    Applicant: 南京大学

    Abstract: 本发明涉及一种提高深度残差脉冲神经网络精度以优化图像分类的方法及其系统,本发明所公开的方法以深度残差神经网络向深度残差脉冲神经网络的转化过程为优化对象,在转化过程中对网络层进行解析、标准化、转换,并进行针对性优化,证明了优化后的深度残差脉冲神经网络在复杂图像识别问题上的有效性;该优化方法提出了迭代平均标准化策略,解决了在对残差神经网络结构中的短路连接进行转化时所面临的标准化难题;该算法优化后的深度残差脉冲神经网络稀疏度高、无乘法的算法性质决定了计算的高效性和硬件友好性;在MNIST数据集上测试时,转化后生成的深度残差脉冲神经网络无精度损失,在CIFAR10数据集上测试的结果仅有1.3%的精度损失,优于现有技术水平。

    一种基于线性STDP的时间编码脉冲神经网络训练方法及系统

    公开(公告)号:CN117195977A

    公开(公告)日:2023-12-08

    申请号:CN202311353936.8

    申请日:2023-10-19

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于线性STDP的时间编码脉冲神经网络训练方法及系统,包括对输入图像的像素进行归一化处理;采用首脉冲时间编码方案,将归一化后的输入图像像素转换为输入脉冲时间,对所述输入脉冲时间进行排序;运用脉冲响应神经元模型,根据排序后的输入脉冲时间计算输出脉冲时间;采用适应性膜阈值技术,根据输出脉冲时间更新首脉冲神经元膜阈值;采用线性STDP学习规则,根据输入脉冲时间、输出脉冲时间和首脉冲神经元膜阈值更新连接到首脉冲神经元的权重。本发明的计算复杂度显著降低,计算成本低,功耗和面积开销降低,硬件实现更加友好。

    一种应用于格密码的串行参数可配快速数论变换硬件加速器

    公开(公告)号:CN113342310B

    公开(公告)日:2023-08-22

    申请号:CN202110679777.5

    申请日:2021-06-18

    Applicant: 南京大学

    Abstract: 本发明提出了一种应用于格密码的串行参数可配快速数论变换硬件加速器,包括顶层控制模块、数据索引模块、单位根幂次模块、蝶形运算单元模块及蒙哥马利模块。顶层控制模块控制状态转换,数据索引模块对数据存储器进行寻址,单位根幂次模块对单位根的幂次进行存储地址计算,蝶形运算单元模块接收来自存储的数据进行蝶形运算,蒙哥马利模块负责将输入数据转换为蒙哥马利形式以加速后续计算,并将结果转换为正常形式避免发生错误。另外,本发明还可以根据实际需求增加随机数发生器进行冗余运算以防御侧信道攻击。与现有技术相比,本发明运算速度大幅度提高,且参数可配置提高了硬件资源的利用率,同时在保证高性能的基础上兼具了一定的通用性。

Patent Agency Ranking