-
公开(公告)号:CN115016918B
公开(公告)日:2024-06-11
申请号:CN202210769041.1
申请日:2022-06-30
Applicant: 中国科学院计算技术研究所
IPC: G06F9/48 , G06F9/50 , G06F16/2455 , G06F16/2457
Abstract: 本发明实施例提供了一种用于数据流架构的计算设备的数据处理方法,所述计算设备包括多个计算节点和多个路由节点,每个计算节点用于调度执行指令槽中的指令,每个路由节点包括共享缓存,所述共享缓存用于缓存指令执行后的数据,共享缓存中指令执行后的数据被发送完毕后释放该数据占用的共享缓存空间,所述方法包括在计算节点执行如下操作:获取指令槽中所有处于就绪可执行状态的指令,对比获取到的所有指令被执行后的数据占用共享缓存后释放共享缓存空间的快慢,选择其中被执行后得到的数据占用的共享缓存空间被最快释放的优选指令进行执行。本发明每次选择当前能够最快释放共享缓存空间的优选指令进行执行,提升数据流架构的效率。
-
-
公开(公告)号:CN113296957B
公开(公告)日:2024-03-05
申请号:CN202110676326.6
申请日:2021-06-18
Applicant: 中国科学院计算技术研究所
IPC: G06F9/50
Abstract: 本发明实施例提供了一种用于动态分配片上网络带宽的方法及装置,该方法获取用户自定义配置的配置文件;根据配置文件将片上网络带宽划分为多个不同优先级的子带宽以及对片上网络上传输的任务进行优先级划分;为各优先级的子带宽分别维护与之对应的任务队列,将相应优先级的任务预分配到与之相同优先级的任务队列;基于轮询机制在每个时间片查询各个任务队列中的可用时间片以及判断相应任务的实时性需求能否满足,若不能满足,则根据所述可用时间片对任务队列中的任务进行重组以跨优先级利用子带宽,本发明可以在片上网络中充分利用带宽,更好地满足片上网络带宽中复杂的任务传输需求。
-
公开(公告)号:CN113451260B
公开(公告)日:2024-01-16
申请号:CN202110612403.1
申请日:2021-06-02
Applicant: 中国科学院计算技术研究所
IPC: H01L23/50 , H10B80/00 , H01L21/768
Abstract: 本发明提出一种基于系统总线的三维芯片及其三维化方法,包括至少两片同构逻辑芯片,且该同构逻辑芯片间相互垂直堆叠,同构逻辑芯片间的各个模块相互重合;每片同构逻辑芯片内部的系统总线与相邻其同构逻辑芯片内部的系统总线相连。本发明通过上述结构实现同构芯片之间的通信,以实现芯片的3D化。
-
公开(公告)号:CN111695685B
公开(公告)日:2023-09-26
申请号:CN202010395809.4
申请日:2020-05-12
Applicant: 中国科学院计算技术研究所
IPC: G06F16/903 , G06F16/901 , G06N3/042 , G06N3/063
Abstract: 本发明提出一种面向图神经网络应用的片上存储系统及方法,包括:步骤1,根据处理单元对图神经网络模型中向量数据的访存请求,判断在片上存储系统的第一级CAM结构中是否有于该访存请求对应的查询结果,若有则执行步骤2,否则判断在片上存储系统的第二级CAM结构中是否有于该访存请求对应的查询结果,若有则执行步骤2,否则根据所需的向量数据批量对片外存储器发起片外访存请求,并替换片上存储内的指定向量数据;步骤2,根据该查询结果,得到对应的SPM索引标记,利用该SPM索引标记中的Sector Index字段以向量方式访问SPM中的相应向量数据,并将该相应数据返回给处理单元。本发明能有效提升面向图神经网络应用的片上存储系统的利用率和访存通量。
-
公开(公告)号:CN113083797B
公开(公告)日:2023-01-24
申请号:CN202110337683.X
申请日:2021-03-30
Applicant: 中国科学院计算技术研究所
Abstract: 提供一种自动检测除尘装置,包括:光源,用于发射探测光;透镜,用于接收所述探测光,并发出平行光;第一光电探测器,用于接收并检测来自所述透镜的光;吸尘装置,用于吸收粉尘;除尘控制板,其被设置用于接收所述第一光电探测器的检测信息,并计算得到当前的粉尘浓度,以及当所述当前的粉尘浓度大于预设阈值时,所述除尘控制板控制所述吸尘装置启动。
-
公开(公告)号:CN115391731A
公开(公告)日:2022-11-25
申请号:CN202210921474.4
申请日:2022-08-02
Applicant: 中国科学院计算技术研究所
Abstract: 本申请公开了一种基于数据流架构的Cholesky分解加速计算方法,所述方法包括:数据准备步骤、矩阵2×2分块计算步骤及矩阵1×1分块计算步骤;将数据流架构中处理单元PE阵列分为多个PE组,将不规则的待计算矩阵按照预定划分规则划分为规则的多个矩阵块,判断规模为N×N的待计算矩阵的N大于预定阈值,则采用基于2×2分块的cholesky拆分算法,循环迭代计算各个PE组中的矩阵块,且通过不同PE组对cholesky分解计算的数据依赖关系,实现PE组间数据传递,待计算矩阵的规模动态调整缩小;判断规模为N×N的所述待计算矩阵的N小于等于预定阈值,采用基于1×1分块的cholesky拆分算法,循环迭代计算,直至计算完成输出计算结果,完成基于数据流架构的Cholesky分解的加速计算。
-
公开(公告)号:CN115390923A
公开(公告)日:2022-11-25
申请号:CN202210843537.9
申请日:2022-07-18
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种基于多模式的SIMD应用高效执行方法和系统,包括:一种能灵活控制SIMD部件运行在不同粒度的SIMD部件架构,使得SIMD部件可以在不同的应用,以及同应用但不同规模等场景下保持高效的利用率。以及与之相配套的搜寻应用最佳粒度并生成应用在对应粒度下的映射方案的方法,以充分发挥多模式SIMD部件的能力。这种多模式SIMD部件能够应用于多种类型的芯片当中。
-
公开(公告)号:CN115374732A
公开(公告)日:2022-11-22
申请号:CN202210880357.8
申请日:2022-07-25
Applicant: 中国科学院计算技术研究所
IPC: G06F30/33 , G06F30/3312 , G06F115/10
Abstract: 本申请公开了一种针对低温多芯片计算系统的模拟方法,方法包括:跨温区多芯片模拟通信系统搭建步骤、低温多芯片功能模拟步骤及低温多芯片时序模拟步骤;搭建相互通信连接的低温多芯片计算系统及室温数据通信系统,基于多种芯片的设计规范,行为级模拟描述低温中用于计算的多种芯片的功能以及多种芯片之间交互运行功能,并模拟多种芯片的输出执行结果;基于多种芯片的设计规范,模拟低温下各芯片内部的周期工作时序,并模拟多种芯片间的通信协议,以模拟低温多芯片计算系统的时序,并验证各个时序的正确性。本发明针对复杂的低温多芯片计算进行仿真和模拟,以便在流片前通过仿真调试及早发现系统问题并进行修改。
-
公开(公告)号:CN115296742A
公开(公告)日:2022-11-04
申请号:CN202210764461.0
申请日:2022-06-29
Applicant: 中国科学院计算技术研究所
IPC: H04B10/25
Abstract: 本发明提出一种板间通信接口系统,包括:多个光纤通信单元,多个光纤通信单元之间通过光纤互联;每一个所述光纤通信单元均配置有光纤通信模块作为通信接口,还配置有Aurora协议IP核模块,与所述光纤通信模块互联。该系统基于Aurora协议实现光纤通信互联,满足了高速率和大容量等需求,使得数据在跨板卡之间也能高效、正确传输,提高传输速率,实现了远距离数据传输,消除了在电磁环境中外部设备对超导设备造成的干扰。
-
-
-
-
-
-
-
-
-