-
公开(公告)号:CN102523169A
公开(公告)日:2012-06-27
申请号:CN201110458022.9
申请日:2011-12-31
Applicant: 南京大学
IPC: H04L12/56
Abstract: 本发明公开了一种基于2D-Mesh多核网络架构的并行化方法,该方法包含任务、数据和流水三个层面的混合并行化;其中:对于运算量较大的若干个并发执行的任务,分配在若干个芯片中并行执行,实现任务并行化;对于一个芯片中的一项任务,若存在可并发执行的数据流处理过程,将其分解到若干个同构的功能模块中并行执行,实现数据并行化;对于能够分解成若干步骤的单向数据处理过程,采用流水线方式并发执行,实现流水并行化。本发明提供了一套完整的软件混合并行化方法,利用该方法与2D-Mesh多核硬件架构相结合可以充分发挥硬件系统的并行效用,有效提高片上软件运行效率,适用于具有一定特征的数字信号处理算法的高速并行实现。
-
公开(公告)号:CN102508803A
公开(公告)日:2012-06-20
申请号:CN201110393660.7
申请日:2011-12-02
Applicant: 南京大学
IPC: G06F13/28
Abstract: 本发明公开了一种矩阵转置存储控制器,该矩阵转置存储控制器包括处理器、总线、直接内存存取、网络接口、存储单元、中断和程序存储器;处理器通过总线与直接内存存取、网络接口,中断、程序存储器进行数据传输;存储单元通过直接内存存取与总线及网络接口连接;网络接口与总线连接,并通过片上网络与外部存储器连接。本发明选择SRAM作为存储器,控制简单,读写操作容易,在处理器的控制下,能充分发挥SRAM作为存储器的优势。本发明提供了三种转置模式;使用处理器控制完成矩阵转置,能灵活地选择转置方法,适用于对各种大小的矩阵进行转置,并具有很好的扩展性。同时,本发明使用DMA作为数据通道,可提供高速的数据传输速率。本发明适用于片上网络中。
-
公开(公告)号:CN102368739A
公开(公告)日:2012-03-07
申请号:CN201110393715.4
申请日:2011-12-02
Applicant: 南京大学
IPC: H04L12/56
Abstract: 本发明公开了一种面向包-电路交换片上网络路由器的广播机制算法,根据片上网络拥塞情况进行路由仲裁,根据链路资源的占用情况动态改变路由路径,记录满足路由条件的输出端口,当遇到有两个可能路径的情况时,采用广播机制,同时选择两条可能路径进行路由尝试,每条路由尝试中都采用了回退转向路由算法,能够避免死锁,选择两条路径中先建立的链路进行数据传输,释放掉另外一条未建立的链路。本发明在同一时间内尝试不同的路由路径,从而可以充分利用网络资源,有效避免了拥塞,同时几乎不影响吞吐量情况下减小了平均包延迟。本发明资源消耗少、传输延时小,适用于实现高性能的片上网络系统。
-
公开(公告)号:CN102497411B
公开(公告)日:2014-01-15
申请号:CN201110405806.5
申请日:2011-12-08
Applicant: 南京大学
IPC: H04L29/08
Abstract: 本发明公开了一种面向密集运算的层次化异构多核片上网络架构,该架构顶层采用二维网格片上网络集成运算簇、转置簇、通信接口以及全局共享存储单元;底层在运算簇和转置簇内部采用总线架构;运算簇内部总线上集成运算单元,集成直接内存存取、网络接口和簇内共享存储单元;转置簇内部总线上集成处理器核、直接内存存取、网络接口和簇内共享存储单元。本发明支持多组全局共享存储单元,彼此之间相互独立,且每个全局共享存储单元通过多个网络接口集成到片上网络;簇内共享存储单元分布在运算簇和转置簇中,运算簇内共享存储单元分为若干相互独立的组。本发明通过层次化多级架构和多通道访存能够有效提高系统的通信性能、数据处理能力和访存带宽。
-
公开(公告)号:CN102497411A
公开(公告)日:2012-06-13
申请号:CN201110405806.5
申请日:2011-12-08
Applicant: 南京大学
IPC: H04L29/08
Abstract: 本发明公开了一种面向密集运算的层次化异构多核片上网络架构,该架构顶层采用二维网格片上网络集成若干个运算簇、转置簇、通信接口以及全局共享存储单元;底层在运算簇和转置簇内部采用总线架构;运算簇内部总线上集成多种运算单元,此外还集成直接内存存取、网络接口和簇内共享存储单元;转置簇内部总线上集成处理器核、直接内存存取、网络接口和簇内共享存储单元。本发明可支持多组全局共享存储单元,彼此之间相互独立,且每个全局共享存储单元可通过多个网络接口集成到片上网络;簇内共享存储单元分布在运算簇和转置簇中,运算簇内的共享存储单元划分为若干个相互独立的组。本发明通过层次化多级架构和多通道访存能够有效提高系统的通信性能、数据处理能力和访存带宽。
-
公开(公告)号:CN102495721A
公开(公告)日:2012-06-13
申请号:CN201110393712.0
申请日:2011-12-02
Applicant: 南京大学
IPC: G06F9/34
Abstract: 本发明公开了一种支持FFT加速的SIMD向量处理器。包括控制单元、计算单元、存储子系统、存储交织单元和地址产生单元:计算单元支持各种向量运算的快速处理;存储器子系统包括三个存储器组,每个存储器组包括四个存储体且存储器组内的单个存储体的位宽为一个复数字,支持4路数据并行的复数向量运算和8路数据并行的实数向量运算;计算单元、地址产生单元和存储交织单元均与控制单元连接;地址产生单元产生所需的操作数地址序列、系数地址序列、结果地址序列;存储交织单元与地址产生单元和计算单元连接,并实现存储体的地址映射。本发明对FFT/IFFT运算的加速效率和专用硬件加速器相当,却避免了使用专用硬件加速器所带来的巨大的额外开销,适用于具有大量长向量运算的实时信号处理系统中。
-
公开(公告)号:CN102075578A
公开(公告)日:2011-05-25
申请号:CN201110021693.9
申请日:2011-01-19
Applicant: 南京大学
IPC: H04L29/08
Abstract: 本发明公开了一种基于分布式存储单元的层次化片上网络架构,该层次化片上网络架构顶层采用二维网格架构集成运算簇及全局共享存储单元;在运算簇内部采用由簇内总线和私有总线构成的层次化总线架构,且簇内总线和私有总线通过总线桥通讯;所述簇内总线上集成网络接口和簇内共享存储单元;所述私有总线上集成私有存储单元和处理器核。本发明中存储系统分为三级:单核私有存储单元,簇内共享存储单元和全局共享存储单元。本发明采用层次化总线及网络架构混合互连方式构建整个NoC通信系统,同时将存储单元也划分到各个层次,有效提高系统通信性能,缓解访存压力,改善片上网络整体通讯性能。
-
-
-
-
-
-