-
公开(公告)号:CN104504205B
公开(公告)日:2017-09-15
申请号:CN201410827960.5
申请日:2014-12-29
Applicant: 南京大学 , 中国电子科技集团公司第十四研究所
IPC: G06F17/50
Abstract: 本发明涉及一种对称FIR算法的并行化二维分割方法,包括设定对称FIR算法的参数:源向量点数,滤波系数长度;2)采用支持四路并行运算的乘法器、加法器通过对称FIR算法处理源数据;3)根据源数据长度,采用不同的算法完成DMA搬运阶段。有益效果为:解决了DMA搬运阶段基于并行化设计的数据细粒度分割、数据存放问题,以及向量长度过大而内存容量受限,需要作多次DMA搬入、处理、搬出,由此带来的源数据粗粒度分割问题。
-
公开(公告)号:CN104504205A
公开(公告)日:2015-04-08
申请号:CN201410827960.5
申请日:2014-12-29
Applicant: 南京大学 , 中国电子科技集团公司第十四研究所
IPC: G06F17/50
Abstract: 本发明涉及一种对称FIR算法的并行化二维分割方法,包括设定对称FIR算法的参数:源向量点数,滤波系数长度;2)采用支持四路并行运算的乘法器、加法器通过对称FIR算法处理源数据;3)根据源数据长度,采用不同的算法完成DMA搬运阶段。有益效果为:解决了DMA搬运阶段基于并行化设计的数据细粒度分割、数据存放问题,以及向量长度过大而内存容量受限,需要作多次DMA搬入、处理、搬出,由此带来的源数据粗粒度分割问题。
-
公开(公告)号:CN101778049A
公开(公告)日:2010-07-14
申请号:CN201010118591.4
申请日:2010-03-04
Applicant: 南京大学 , 中国电子科技集团公司第十四研究所
IPC: H04L12/56
Abstract: 本发明公开了一种构成片上网络的包-电路交换片上路由器及其传输方法,该路由器中的输入状态机控制输入通道的工作状态,并将接收的请求信号传送给优先级编码器;优先级编码器根据设定的固定优先级对请求信号进行编码,并通过地址译码器将输入的目标节点地址信号转变为路由方向信号输出;仲裁器接受地址译码器的解码结果,根据固定优先级顺序和端口占用情况,输出输入端口与输出端口互连信号及输出端口占用信号,直到选择合适的路径到达目的节点;交叉开关接收仲裁器输出的互连信号,实现输入、输出端口之间的正确互连。本发明资源消耗少,传输延时小,适用于构成高性能片上网络,可以用于采用片上网络结构的复杂片上系统。
-
公开(公告)号:CN104461465A
公开(公告)日:2015-03-25
申请号:CN201410833374.1
申请日:2014-12-29
Applicant: 南京大学 , 中国电子科技集团公司第十四研究所
Abstract: 本发明涉及一种基于乒乓操作的高效率控制器,与外部DSP核连接,包括外部接口模块,用于实现控制器与外部DSP之间的数据传递;主状态机模块,用于完成状态的跳转,通过将计算时间掩盖搬运数据的时间,实现乒乓功能;寄存器组,用于实现外部DSP与本控制器的信息交互;存储分配单元,用于完成内部存储的分配,为实现乒乓操作提供存储资源基础。有益效果为:将内部存储资源分为两部分,在前半部分运算时,搬运后半部分所需的数据,从而掩盖部分搬运数据的时间,实现乒乓操作流程,提高实际运算效率。
-
公开(公告)号:CN119474000A
公开(公告)日:2025-02-18
申请号:CN202411507882.0
申请日:2024-10-28
Applicant: 南京大学
IPC: G06F15/78 , G06F15/173 , G06F7/544 , G06N3/063 , G06N3/0464
Abstract: 本发明涉及近似片上网络技术领域,公开了一种面向卷积神经网络加速的高实时性近似片上网络,结合神经网络的数据分布情况,提出基于数据分级的近似压缩和分段恢复方案,实现在降低通信开销的同时,保持神经网络推理精度;并提出一个质量控制模型,该模型能够快速搜索出满足质量损失约束的神经网络各层阈值,确保网络在进行近似通信的同时保持准确性;进一步提出基于拥塞感知的阈值动态调整方案,通过感知网络中的拥塞情况,动态调整每一层的近似阈值,以实现对数据压缩率的实时优化,从而有效缓解通信网络中的拥塞问题;结合近似通信后网络中的激活数据分布特征,优化计算阵列中的近似计算模块,提升计算阵列的整体效率,实现计算加速。
-
公开(公告)号:CN119441950A
公开(公告)日:2025-02-14
申请号:CN202411575006.1
申请日:2024-11-06
Applicant: 南京大学
IPC: G06F18/24 , G06F18/213 , G06F18/25 , G06N3/042 , G06N3/0464 , G06F18/22 , G06N3/0442 , A61B5/00 , A61B5/369
Abstract: 本发明公开了一种面向癫痫监测的小样本脑电信号分类方法,属于脑电信号处理及分类技术领域,其方法具体包括:构建癫痫四分类融合模型,包括:共享网络层、二分类子网络层和三分类子网络层,获取癫痫脑电信号样本,将癫痫脑电信号样本输入到共享网络层,对癫痫脑电信号样本进行特征提取,捕捉癫痫脑电信号的复杂特征,将提取的癫痫脑电信号的复杂特征输入至癫痫四分类融合模型中,输出脑电信号分类结果,利用条件加权投票算法对脑电信号分类结果进行加权投票,输出投票结果,考虑了不同时期的数据特征差异以及数据量差异,通过将四分类任务拆分为二分类和三分类,结合条件加权投票算法,使得模型在发作期很少的小样本情况下也能保持较好的学习效果和速率。
-
公开(公告)号:CN119376449A
公开(公告)日:2025-01-28
申请号:CN202411490434.4
申请日:2024-10-24
Applicant: 南京大学
IPC: G05D23/19
Abstract: 本发明公开了一种基于片上网络的紧凑型交叉温控方法,涉及多处理器嵌入式开发技术领域,设计交错相位控制策略以增加控制周期内最小网络单元的节点纠正次数,避免同步温控引起的热问题,设计负反馈温控策略以控制节点和邻接节点之间的交互行为,进一步稳定节点的温度,基于控制相位分配算法将片上网络中节点类型的分配类比为图着色问题,设置剪枝约束和选取约束以优化回溯法,快速生成最优类型分配方案,并结合交错相位控制策略和负反馈温控策略实现片上网络的最佳交叉温控,设计性能评估方案,经检验,本发明提出的方法在评估指标上均优于对比方案,有效解决了片上网络的热问题。
-
公开(公告)号:CN113131950B
公开(公告)日:2024-02-13
申请号:CN202110442919.6
申请日:2021-04-23
Applicant: 南京大学
IPC: H03M13/13
Abstract: 本发明提供了一种极化码的自适应连续消除优先译码方法,其中所述方法采用基于优先级的搜索策略和网格存储策略,使用优先队列存储优先级信息并根据码字的子节点类型指导候选路径的扩展,使用网格结构计算并存储中间结果,同时采用一种基于路径度量的自适应节点插入策略来减少优先队列中的路径数量,通过优先级队列与网格结构的迭代信息交互,完成极化码译码。本发明的目的在于,利用优先级搜索策略降低译码算法的复杂度,通过自适应节点插入策略避免了大多数不必要的路径扩展,在保证译码性能的同时,显著降低了算法的时间复杂度。
-
公开(公告)号:CN113377333B
公开(公告)日:2023-08-22
申请号:CN202110602128.5
申请日:2021-05-31
Applicant: 南京大学
Abstract: 本发明提出了基于抛物线综合法求复数的N次开根号的硬件计算系统和方法。该系统包括:控制单元使用状态机的方式控制整个系统的运算流程;可变模式的圆周CORDIC计算单元,用以实现输入复数在平面坐标形式与极坐标形式之间的相互转化;开根单元,用以计算待求复数的极坐标形式中的模长的N次开根;相角计算单元,根据输入k用以计算得到复数的极坐标形式中的相角。有效地利用抛物线综合法和CORDIC方法,既保证了计算精度,又让整个计算系统实现超低时延计算。其次,通过改变输入k,可选择需要输出的N次开根结果。改变圆周CORDIC模块的正向迭代次数,可在一定范围内灵活地调节计算精度。最后,减少了整个系统的面积消耗。
-
公开(公告)号:CN113127802B
公开(公告)日:2023-08-08
申请号:CN202110459595.7
申请日:2021-04-27
Applicant: 南京大学
Abstract: 本发明首次提出了一种基于CORDIC算法的复对数实现方法、装置、设备及计算机存储介质,主要利用圆周向量模块(VC‑CORDIC),双曲向量模块(VH‑CORDIC)进行联级操作。首先,将所需计算目标的实部和虚部输入圆周向量模块(VC‑CORDIC)进行迭代计算,VC‑CORDIC模块得出所求结果的虚部以及实部中间值;然后将实部中间值的相邻值作为VH‑CORDIC模块的输入进行迭代计算,得出的结果经过减法和移位操作之后得到所求结果的实部,进一步减少了计算的复杂度,相比于传统的查找表、线性近似的方法,本发明具有精度高、面积小、功耗低的特点。
-
-
-
-
-
-
-
-
-