一种基于相关性和人工神经网络的众核芯片温度重构方法

    公开(公告)号:CN113467590A

    公开(公告)日:2021-10-01

    申请号:CN202111035472.7

    申请日:2021-09-06

    Applicant: 南京大学

    Abstract: 本发明提出了一种基于相关性和人工神经网络的众核芯片温度重构方法及系统,该方法基于众核芯片核与核之间温度变化之间的相关性确定了热传感器的分布位置;人工神经网络能够根据热传感器获得的部分核的温度得出众核芯片中所有核的温度。本发明可以支持众核芯片在多种负载情况下进行温度重构;当众核芯片运行多种不同的应用的时候不需要重新确定热传感器的分配位置和也无需重新训练人工神经网络。本发明所需热传感器数目少,重构得到的温度精度高,能适应多种负载情况,因此有着良好的实用价值和广泛的应用前景。

    一种粗粒度动态可重构处理器及其数据处理方法

    公开(公告)号:CN112732639A

    公开(公告)日:2021-04-30

    申请号:CN202110355308.8

    申请日:2021-04-01

    Applicant: 南京大学

    Abstract: 本发明涉及一种粗粒度动态可重构处理器及其数据处理方法,包括用于解析配置信息的控制单元;用于接收来自所述控制单元解析得到的配置信息的可重构控制单元;由多个片上存储块组成的片上存储池;产生所述片上存储块访存地址的无冲突地址生成器;直接存储器访问模块;以及位于所述直接存储器访问模块与存储池之间的数据分发模块。本发明通过两阶段配置、配置信息预取、第二阶段部分配置等方式,可实现下一个算子与当前算子的快速动态切换;同时,通过优化设计的可重构计算阵列、无冲突地址生成器等方式,可实现高性能、高能效的算子实现。

    一种可配置自适应负载平衡系统及方法

    公开(公告)号:CN106803816B

    公开(公告)日:2020-04-07

    申请号:CN201710190941.X

    申请日:2017-03-27

    Applicant: 南京大学

    Abstract: 本发明涉及一种可配置自适应负载平衡系统,与多核处理器通信连接,接收多核处理器发送的配置包与门铃信息,配置包解析模块,根据所述配置包解析出合并模式选择信息、光纤波束数、处理簇数以及模块参数,调配系统各内部模块协同工作;若干通用数据发送模块,根据所述合并模式选择信息、光纤波束数和模块参数,并输出各种组合情形下的帧数据与选通信号;忙闲表管理模块,根据所述处理簇数创建忙闲表,并从忙闲表中读出与处理簇数对应的帧数据与ID号,并将所述帧数据与ID号输出;Srio组包模块,根据所述ID号组成Srio包,并根据忙闲表进行帧数据发送。有益效果为:节省了芯片的面积,并且满足系统实时性的要求。

    面向具有对称性的非线性函数通用计算装置和方法

    公开(公告)号:CN110058841A

    公开(公告)日:2019-07-26

    申请号:CN201910321975.7

    申请日:2019-04-22

    Applicant: 南京大学

    Abstract: 本发明提供了一种面向具有对称性的非线性函数的通用计算装置和方法。计算装置包括取绝对值单元、地址索引单元、查找表单元、乘加单元、取符号位单元、减法器和选择器。其中,地址索引单元包括比较器、控制器、地址寄存器和分段端点存储器。本发明提供的面向具有对称性的非线性函数计算装置,可以计算任意具有轴对称或中心对称的非线性函数值,具有一定的通用性。同时本发明根据目标分段线性函数与原始非线性函数的最大绝对误差对原始非线性函数进行分段处理,可实现近似计算结果的精度可控。

    一种除氟用改性方解石吸附剂的制备方法

    公开(公告)号:CN110038510A

    公开(公告)日:2019-07-23

    申请号:CN201910352111.1

    申请日:2019-04-29

    Applicant: 南京大学

    Inventor: 李伟 王敬朝 任超

    Abstract: 本发明涉及一种除氟用改性方解石吸附剂的制备方法,首先制备磷酸氢二钠和氯化钠的混合溶液,往混合溶液中加入方解石粉末,固液比为15-25g/L,混合均匀后,调pH8,在室温下搅拌反应,搅拌反应过程中,调节并保持反应体系的pH为8,反应结束后,得到反应液,抽滤,然后用去离子水清洗滤饼,将滤饼进行冷冻干燥后,研细,得到改性材料粉末,将其与凹凸棒石粉末以8-15:1的体积比混合均匀,得到料粉,将料粉加入到糖衣机中,滴加去离子水进行造粒,得到球形颗粒,将球形颗粒在马弗炉中煅烧,然后冷却,即得。本发明方法简单,成本低廉,制得的改性方解石吸附剂对水溶液中氟离子的具有优良的吸附性能。

    一种基于控制器流水架构的层次化信息处理方法及电路

    公开(公告)号:CN105930598B

    公开(公告)日:2019-05-03

    申请号:CN201610270325.0

    申请日:2016-04-27

    Applicant: 南京大学

    Abstract: 本发明涉及基于控制器流水架构的层次化信息处理方法及电路,所述方法包括如下步骤:1)主处理核接收输入信号,并根据输入信号的数据处理需求向下级的可配置流水信号处理核发送配置参数;2)可配置流水信号处理核接收所述配置参数,并将可配置流水信号处理核内置的状态寄存器的状态信息反馈至主处理核,若所述至少有一个可配置流水信号处理核的状态信息处于空闲状态,则执行步骤3);3)所述主处理核优先选取与输入信号的数据处理需求相匹配的配置的可配置流水信号处理核;4)可配置流水信号处理核完成相应的运算后,更新自身的状态寄存器,同时向主处理核发中断,结束数据处理操作,具有可扩展性、灵活性以及多变性的特点。

    一种基于归并树的全排序加速器及应用

    公开(公告)号:CN106843803B

    公开(公告)日:2019-04-23

    申请号:CN201611222156.X

    申请日:2016-12-27

    Applicant: 南京大学

    Abstract: 本发明的基于归并树的全排序加速器,包括:主控模块,接收运算信号,并根据所述运算信号确定排序、合并的次数、排序点数以及读写地址;输出控制信号,控制合并的开始和结束;运算单元,由若干比较器组成,根据所述运算信号执行比较逻辑运算,输出中间结果;FIFO存储单元,由若干寄存器组成,接收所述中间结果并存储,根据所述传输信号,执行中间结果的读写操作;主控制器与每一比较器、寄存器形成映射形成一个结点,所有结点形成归并树的处理结构。有益效果:资源开销较小使用更加灵活,同时有良好的并行性来满足高吞吐量系统的需求。

    一种可重构CNN高并发卷积加速器

    公开(公告)号:CN108805266A

    公开(公告)日:2018-11-13

    申请号:CN201810497967.3

    申请日:2018-05-21

    Applicant: 南京大学

    CPC classification number: G06N3/0454

    Abstract: 本发明提供了一种可重构CNN高并发卷积加速器,包括:权重地址生成单元,生成卷积核数据在缓存中的地址;结果地址生成单元,生成结果数据在缓存中的地址;可重构计算单元,可将计算阵列重构为两种不同粒度的乘累加树电路;特征图地址生成单元,生成特征图数据在缓存中的地址;主控制器,生成与地址同步的累加器清零信号,选通可重构计算单元中对应的电路,产生整个运算结束的中断信号;存储交换单元,将有效的特征图读地址、权重读地址转换为对存储单元的读操作,将有效的结果写地址和数据转换为对存储单元的写操作。有益效果:简化控制部分,极大地提高多通道二维卷积运算并行度和对存储访问的效率,减少占用的资源。

    用于BNN硬件加速器的双向并行处理卷积加速系统

    公开(公告)号:CN108665063A

    公开(公告)日:2018-10-16

    申请号:CN201810480881.X

    申请日:2018-05-18

    Applicant: 南京大学

    Abstract: 本发明提供了一种用于BNN硬件加速器的双向数据级并行处理卷积加速系统包括:存储单元,用于存储输入的激励数据、卷积核参数以及该层卷积运算结束后的结果;运算控制器,控制各个卷积层之间数据的传递、激励的输入与读取卷积核参数的读取、参数运算以及计算结果的存储;卷积运算模块,根据所述控制器指令,读取缓冲单元里的数据和参数,完成卷积操作;数据搬运模块,根据运算控制器的配置信息,将所有参数与激励数据从片外DDR搬运至片上存储器。通过增加运算资源和数据存储资源的开销,大大提高了运算吞吐率。

    一种可重构回波脉冲与光声信号的采集和预处理系统

    公开(公告)号:CN108594714A

    公开(公告)日:2018-09-28

    申请号:CN201810480854.2

    申请日:2018-05-18

    Applicant: 南京大学

    Abstract: 本发明涉及可重构回波脉冲与光声信号的采集和预处理系统,包括发射板卡,通过电缆连接换能器探头,控制换能器发射超声波;接收板卡,包括总线接口、存储模块、接收触发模块、动态聚焦模块、多个预处理模块以及模拟前端,每个模拟前端通过电缆连接超声换能器阵列,接收超声换能器阵列发出的模拟信号,将动态聚焦保存至所述存储模块中;控制板,通过总线接口与发射板卡、接收板卡完成数据传输和参数配置,与上位机进行数据传输,并接收激光器发出的用以触发接收板卡的同步脉冲。所述方法基于FPGA,仅需根据实际需要和其它硬件配置调整FPGA中的参数,即可适用于不同超声换能器阵列、不同扫描方式、不同应用的光声、超声成像,且可以在这两种成像模式之间进行切换。

Patent Agency Ranking