-
公开(公告)号:CN109635937B
公开(公告)日:2023-07-11
申请号:CN201811646420.1
申请日:2018-12-30
Applicant: 南京大学
IPC: G06N3/063 , G06N3/0464
Abstract: 本发明的面向低位宽卷积神经网络的低功耗系统包括:控制器、配置器、计算单元、片上存储单元、片上存储控制单元和总线接口;采用流处理架构,将总任务切分为几个子任务流水处理;发明了任务均衡切割策略,能提高吞吐率,减少每帧图像识别时间;其针对低位宽卷积神经网络算法特点,实现了一种硬件友好的算法优化,可省略批标准化层的处理步骤。该系统因其超低功耗,超小面积、吞吐率高的特点,非常适用于嵌入式、物联网应用领域,能够高效率完成图像识别、人脸识别等功能。
-
公开(公告)号:CN116318639A
公开(公告)日:2023-06-23
申请号:CN202211093758.5
申请日:2022-09-08
Applicant: 南京大学
IPC: H04L9/08
Abstract: 本发明提出了一种轻量化Twofish加密算法加速器及其加速方法,其中的主要的模块包括控制器模块、子密钥生成模块、轮运算模块和输入输出白化模块。本发明提出了实现S盒单元置换功能的高效硬件加速电路,并在每一轮运算中引入线性反馈移位寄存器随机选择S盒中的置换电路,从而提高加密过程的安全性;本发明提出的轮运算模块与扩展子秘钥生成单元这两个核心部分在硬件资源上高度共享,根据控制信号切换功能交替运行,因此资源利用较少,硬件实现规模小轻量化,能够良好地适应在SoC中的模块集成。
-
公开(公告)号:CN108762719B
公开(公告)日:2023-06-06
申请号:CN201810497969.2
申请日:2018-05-21
Applicant: 南京大学
Abstract: 本发明的并行广义内积重构控制器,包括:中间结果计算模块,接收源数据并根据源数据计算中间结果向量,生成向量的地址,存入bank;每完成一个的计算生成一个完成信号,并将所述完成信号发送至最终结果计算模块,作为启动信号;最终结果计算模块,读数据进入复数乘累加器进行最终结果计算得到结果矩阵第L个元素,生成向量的地址,存入bank;数据存储地址处理模块,根据乒乓操作选择信号进行数据选择,生成正确的bank地址信号。有益效果:计算时间少且存储资源利用率大,可满足在许多信号检测应用场景中进行非均匀检测时,获取检验统计量的高实时性要求。
-
公开(公告)号:CN109711543B
公开(公告)日:2023-05-09
申请号:CN201811646423.5
申请日:2018-12-30
Applicant: 南京大学
IPC: G06N3/063 , G06N3/0475 , G06N3/088
Abstract: 本发明公开了可重构的深度置信网络实现系统,该系统包括:控制单元用于控制深度置信网络算法的运算流程;数据暂存单元用于存储计算所需的输入层信息、权重、偏置及输出层结果;受限玻尔兹曼机用于计算深度置信网络中各层结点的激活概率,以决定其激活状态;参数更新单元用于更新深度置信网络中各层结点的权重及偏置,其仅在训练算法中被激活。有益效果:该实现系统通过复用受限玻尔兹曼机及控制算法状态跳转可支持训练和推理两种算法,降低了算法的硬件资源开销,并保证了算法性能,适用于各种人工智能场景。
-
公开(公告)号:CN115603894A
公开(公告)日:2023-01-13
申请号:CN202211189124.X
申请日:2022-09-28
Applicant: 南京大学(CN)
IPC: H04L9/06
Abstract: 本发明提出了一种面向于B5G系统的可重构加速器及加速方法。该硬件设计包括可重构控制器模块,用于生成算法选择信号;还包括可重构线性反馈移位寄存器(LFSR)模块,用于循环生成流密码算法运算所用数据;还包括有限状态机(FSM)模块,通过FSM中循环计算最终得出密文。其中可以满足多种流密码算法共模使用LFSR模块,使用各自的计算反馈单元和不同的抽头选取位置适应不同加速场景,即根据输入的算法选择信号,选择不同的数据链路和计算模块。本发明提出的硬件架构可以在B5G系统下根据多种不同场景需求可以自由选择加密效果更佳的算法,共模的设计可以更好地满足B5G系统的超高速加密需求。
-
公开(公告)号:CN115550235A
公开(公告)日:2022-12-30
申请号:CN202211014355.7
申请日:2022-08-23
Applicant: 南京大学
IPC: H04L45/00 , H04L45/586 , H04L45/60
Abstract: 本发明公开一种面向神经网络平台的单周期路由器,属于片上网络技术领域。本发明基于XY维序路由算法,根据切片可能前往的输出方向为不同端口的输入缓冲区分配异构的虚通道;在路由器中设有虚通道标识更新单元,通过虚通道标识更新提前判断切片在下一跳路由写入的虚通道即下一跳路由的输出方向,并更新其通道标识位,该逻辑时序开销隐藏在切片的线传输延时中。本发明通过对不同向通信流量的异构处理,简化了仲裁单元的数量和结构,降低了仲裁逻辑的时序开销,优化了路由流水线,有效降低片上网络的通信延时,改善网络扩展带来的延时上升情况,实现了单切片快速通行的方案,具有良好的使用价值和广泛的应用前景。
-
公开(公告)号:CN115277563A
公开(公告)日:2022-11-01
申请号:CN202210636087.6
申请日:2022-06-07
Applicant: 南京大学
IPC: H04L47/12 , H04L47/32 , H04L47/38 , H04L45/028
Abstract: 本发明公开了一种基于离线强化学习的片上网络近似控制系统。本发明采用离线强化学习算法,利用软硬件协同手段,在软件端训练,在硬件端部署;片上网络中设置全局近似控制器用来部署决策神经网络;其余节点利用局部数据控制器根据全局近似控制器的发送的信息调整数据近似率。本发明通过离线强化学习算法对决策网络进行训练,将训练完成的决策网络部署至硬件中,能在不同的应用条件下感知网络拥塞状态,动态调整数据近似率使得网络在传输质量和网络性能两者之间达到良好平衡。
-
公开(公告)号:CN113727161B
公开(公告)日:2022-07-29
申请号:CN202111032732.5
申请日:2021-09-03
Applicant: 南京大学
IPC: H04N21/426 , H04N21/433 , H04N21/44 , H04N21/4402 , H04N21/472
Abstract: 本发明提出了一种基于microblaze的实时视频接缝剪裁方法及系统,可用于采集视频后进行接缝剪裁处理并实时显示。其中所述系统由PL端以及PS端两部分共同实现,结合改进的视频接缝剪裁运算方法处理图像,在针对缩小或放大图像时相比原有的Seam Carving算法,在保留视频信息的同时进一步减小画面失真,让用户获得更好的视觉效果。另一方面,本发明提出的系统资源占用小,可移植性强,兼具软件编程调试方便与硬件计算处理速度快的优点,软硬件协同工作增加处理速度,减小时延,在保留显示视频完整信息的同时可任意更改画面尺寸,能适配各种规格显示设备,适用于各种直播或监控场景。
-
公开(公告)号:CN114749163A
公开(公告)日:2022-07-15
申请号:CN202210404334.X
申请日:2022-04-18
Applicant: 南京大学
IPC: B01J20/30 , B01J20/08 , C02F1/28 , C02F101/10
Abstract: 本发明涉及一种Ce‑Al除磷材料的制备方法,将六水合硝酸铈和九水合硝酸铝加入到硝酸钠溶液中溶解,得到混合溶液,搅拌下,将混合溶液和氢氧化钠溶液同时滴入到硝酸钠溶液中,氢氧化钠溶液的用量以控制体系pH值等于9为宜,滴加完成后继续搅拌反应,将反应产物离心,用去离子水洗涤,最后将固体产物真空干燥,即得。本发明以六水合硝酸铈和九水合硝酸铝为原料,合成了一种Ce‑Al除磷材料,方法简单,原料成本低,该除磷材料具有优异的除磷效果,并且适用pH范围宽泛,具有很好的经济效益和环境效益,另外,本发明的除磷材料为粉末状,便于运输,具有长途运输、产业化、商业化的潜力。
-
公开(公告)号:CN114039719A
公开(公告)日:2022-02-11
申请号:CN202111307012.5
申请日:2021-11-05
Applicant: 南京大学
IPC: H04L9/06
Abstract: 本发明提出了一种应用于5G系统的SNOW‑V算法加速器及其加速方法,其中所述加速器包括由两个移位寄存器组成的LFSR模块,用于生成SNOW‑V算法运算所需数据的一个循环结构;还包括由寄存器、加法器和AES加密轮组成的FSM模块,通过FSM中各个单元之间的循环计算,最终生成密钥流不断输出,该密钥流与明文异或后得到密文。本发明提出的硬件架构资源利用率高,能够快速地生成密钥流,同时可以在未来满足5G系统的超高速加密需求。
-
-
-
-
-
-
-
-
-