-
公开(公告)号:CN101808032A
公开(公告)日:2010-08-18
申请号:CN201010118584.4
申请日:2010-03-04
Applicant: 南京大学 , 中国电子科技集团公司第十四研究所
IPC: H04L12/56
Abstract: 本发明公开了一种面向静态XY路由算法的二维网格片上网络路由器优化设计方法,该方法分别对路由器的输入和输出通道进行优化设计,并根据路由器在网格中的不同位置,对其进行异构设计。在输入通道中,由于静态XY路由算法中南、北方向的输入通道不向东、西方向的输出通道发出请求,且任一输入通道都不产生回传请求,因此对各输入通道中的路由逻辑分别进行简化。在输出通道中,东、西方向输出通道只需处理2个输入通道的请求,而其余通道也只需处理4个输入请求。对于二维网格结构的NoC,位于网格边缘和拐角的路由器分别只需4对和3对输入、输出通道。本发明可以有效提高片上网络路由器的最大工作频率,减小其硬件开销,有着良好的应用价值。
-
公开(公告)号:CN101808032B
公开(公告)日:2012-07-25
申请号:CN201010118584.4
申请日:2010-03-04
Applicant: 南京大学 , 中国电子科技集团公司第十四研究所
IPC: H04L12/56
Abstract: 本发明公开了一种面向静态XY路由算法的二维网格片上网络路由器优化设计方法,该方法分别对路由器的输入和输出通道进行优化设计,并根据路由器在网格中的不同位置,对其进行异构设计。在输入通道中,由于静态XY路由算法中南、北方向的输入通道不向东、西方向的输出通道发出请求,且任一输入通道都不产生回传请求,因此对各输入通道中的路由逻辑分别进行简化。在输出通道中,东、西方向输出通道只需处理2个输入通道的请求,而其余通道也只需处理4个输入请求。对于二维网格结构的NoC,位于网格边缘和拐角的路由器分别只需4对和3对输入、输出通道。本发明可以有效提高片上网络路由器的最大工作频率,减小其硬件开销,有着良好的应用价值。
-
公开(公告)号:CN102508935A
公开(公告)日:2012-06-20
申请号:CN201110283124.1
申请日:2011-09-22
Applicant: 南京大学
Abstract: 一种基于蚁群混沌遗传算法的片上网络映射方法,以标准蚁群算法为基础,同时引入遗传算法,对每只蚂蚁的参数采用实数编码,并以该编码为遗传算法中的染色体,在每一轮迭代中使用遗传算法对编码过的蚁群算法参数进行调整。在算法运行过程中,本发明还对算法中每一轮循环的结果进行监测,如果监测到算法陷入局部最优解,则通过引入混沌模型的方法加大遗传算法的突变概率,进而再通过遗传算法修改蚁群算法参数。本发明可以有效提高算法对解空间的搜索能力,避免其停滞于局部最优解,对于大规模片上网络映射问题的求解有着良好的实用价值和广泛的应用前景。
-
公开(公告)号:CN102158380B
公开(公告)日:2013-05-08
申请号:CN201110041623.X
申请日:2011-02-21
Applicant: 南京大学
Abstract: 本发明公开了一种基于统计时分复用技术的多簇片上网络架构,该架构在簇内采用基于统计时分复用技术的总线结构;在总线上设有主设备、从设备、总线部件及统计时分复用控制单元;统计时分复用控制单元与主设备、从设备及总线部件连接;其中,从设备包括存储器及具有等待机制的网络接口;总线部件包括仲裁器、解码器以及多路选择器;统计时分复用控制单元统筹控制总线上主设备、从设备来实现统计时分复用机制;具有等待机制的网络接口接收总线上主设备发起的数据传输请求,并在满足触发条件情况下触发传输。本发明可以有效降低网络负荷、减小通信延时,进而提高片上网络系统整体性能,因此有着良好的实用价值和广泛的应用前景。
-
公开(公告)号:CN102508803A
公开(公告)日:2012-06-20
申请号:CN201110393660.7
申请日:2011-12-02
Applicant: 南京大学
IPC: G06F13/28
Abstract: 本发明公开了一种矩阵转置存储控制器,该矩阵转置存储控制器包括处理器、总线、直接内存存取、网络接口、存储单元、中断和程序存储器;处理器通过总线与直接内存存取、网络接口,中断、程序存储器进行数据传输;存储单元通过直接内存存取与总线及网络接口连接;网络接口与总线连接,并通过片上网络与外部存储器连接。本发明选择SRAM作为存储器,控制简单,读写操作容易,在处理器的控制下,能充分发挥SRAM作为存储器的优势。本发明提供了三种转置模式;使用处理器控制完成矩阵转置,能灵活地选择转置方法,适用于对各种大小的矩阵进行转置,并具有很好的扩展性。同时,本发明使用DMA作为数据通道,可提供高速的数据传输速率。本发明适用于片上网络中。
-
公开(公告)号:CN102158380A
公开(公告)日:2011-08-17
申请号:CN201110041623.X
申请日:2011-02-21
Applicant: 南京大学
Abstract: 本发明公开了一种基于统计时分复用技术的多簇片上网络架构,该架构在簇内采用基于统计时分复用技术的总线结构;在总线上设有主设备、从设备、总线部件及统计时分复用控制单元;统计时分复用控制单元与主设备、从设备及总线部件连接;其中,从设备包括存储器及具有等待机制的网络接口;总线部件包括仲裁器、解码器以及多路选择器;统计时分复用控制单元统筹控制总线上主设备、从设备来实现统计时分复用机制;具有等待机制的网络接口接收总线上主设备发起的数据传输请求,并在满足触发条件情况下触发传输。本发明可以有效降低网络负荷、减小通信延时,进而提高片上网络系统整体性能,因此有着良好的实用价值和广泛的应用前景。
-
公开(公告)号:CN102075578A
公开(公告)日:2011-05-25
申请号:CN201110021693.9
申请日:2011-01-19
Applicant: 南京大学
IPC: H04L29/08
Abstract: 本发明公开了一种基于分布式存储单元的层次化片上网络架构,该层次化片上网络架构顶层采用二维网格架构集成运算簇及全局共享存储单元;在运算簇内部采用由簇内总线和私有总线构成的层次化总线架构,且簇内总线和私有总线通过总线桥通讯;所述簇内总线上集成网络接口和簇内共享存储单元;所述私有总线上集成私有存储单元和处理器核。本发明中存储系统分为三级:单核私有存储单元,簇内共享存储单元和全局共享存储单元。本发明采用层次化总线及网络架构混合互连方式构建整个NoC通信系统,同时将存储单元也划分到各个层次,有效提高系统通信性能,缓解访存压力,改善片上网络整体通讯性能。
-
公开(公告)号:CN102497411B
公开(公告)日:2014-01-15
申请号:CN201110405806.5
申请日:2011-12-08
Applicant: 南京大学
IPC: H04L29/08
Abstract: 本发明公开了一种面向密集运算的层次化异构多核片上网络架构,该架构顶层采用二维网格片上网络集成运算簇、转置簇、通信接口以及全局共享存储单元;底层在运算簇和转置簇内部采用总线架构;运算簇内部总线上集成运算单元,集成直接内存存取、网络接口和簇内共享存储单元;转置簇内部总线上集成处理器核、直接内存存取、网络接口和簇内共享存储单元。本发明支持多组全局共享存储单元,彼此之间相互独立,且每个全局共享存储单元通过多个网络接口集成到片上网络;簇内共享存储单元分布在运算簇和转置簇中,运算簇内共享存储单元分为若干相互独立的组。本发明通过层次化多级架构和多通道访存能够有效提高系统的通信性能、数据处理能力和访存带宽。
-
公开(公告)号:CN102497411A
公开(公告)日:2012-06-13
申请号:CN201110405806.5
申请日:2011-12-08
Applicant: 南京大学
IPC: H04L29/08
Abstract: 本发明公开了一种面向密集运算的层次化异构多核片上网络架构,该架构顶层采用二维网格片上网络集成若干个运算簇、转置簇、通信接口以及全局共享存储单元;底层在运算簇和转置簇内部采用总线架构;运算簇内部总线上集成多种运算单元,此外还集成直接内存存取、网络接口和簇内共享存储单元;转置簇内部总线上集成处理器核、直接内存存取、网络接口和簇内共享存储单元。本发明可支持多组全局共享存储单元,彼此之间相互独立,且每个全局共享存储单元可通过多个网络接口集成到片上网络;簇内共享存储单元分布在运算簇和转置簇中,运算簇内的共享存储单元划分为若干个相互独立的组。本发明通过层次化多级架构和多通道访存能够有效提高系统的通信性能、数据处理能力和访存带宽。
-
公开(公告)号:CN102495721A
公开(公告)日:2012-06-13
申请号:CN201110393712.0
申请日:2011-12-02
Applicant: 南京大学
IPC: G06F9/34
Abstract: 本发明公开了一种支持FFT加速的SIMD向量处理器。包括控制单元、计算单元、存储子系统、存储交织单元和地址产生单元:计算单元支持各种向量运算的快速处理;存储器子系统包括三个存储器组,每个存储器组包括四个存储体且存储器组内的单个存储体的位宽为一个复数字,支持4路数据并行的复数向量运算和8路数据并行的实数向量运算;计算单元、地址产生单元和存储交织单元均与控制单元连接;地址产生单元产生所需的操作数地址序列、系数地址序列、结果地址序列;存储交织单元与地址产生单元和计算单元连接,并实现存储体的地址映射。本发明对FFT/IFFT运算的加速效率和专用硬件加速器相当,却避免了使用专用硬件加速器所带来的巨大的额外开销,适用于具有大量长向量运算的实时信号处理系统中。
-
-
-
-
-
-
-
-
-