-
公开(公告)号:CN100574310C
公开(公告)日:2009-12-23
申请号:CN200710120756.X
申请日:2007-08-24
Applicant: 中国科学院计算技术研究所
Abstract: 本发明公开了一种信誉流量控制方法,包括:当所要发送数据包的大小小于远端信誉值计数器中的信誉值时,发送所述数据包,并执行下一步,否则,不发送所述数据包;根据所发送数据包的大小,减少远端信誉值计数器中的信誉值;接收数据包,并减少所述本地信誉值计数器中的信誉值;对下一个数据包的长度进行预测;根据预测结果,信誉值,以及接收缓冲区空闲空间的大小,决定是否需要发送包含有新信誉值的流控包。本发明不会盲目发送流控信息,只会根据当前数据流情况,自适应的在链路恰好需要流控信息时发送有效流控包,以保证数据流不断流,从而提高物理链路和缓冲区资源利用率。
-
公开(公告)号:CN101330341A
公开(公告)日:2008-12-24
申请号:CN200810117592.X
申请日:2008-08-01
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及一种栅障同步方法及系统。该方法包括:配置中间节点的子端口配置寄存器和父端口配置寄存器,以及根节点的子端口配置寄存器,以确定一棵栅障树中节点间互连关系;叶子节点在到达栅障同步点后,向其父节点发送栅障规约包;中间节点接收到其所有的叶子节点发送的栅障规约包后,向其父节点发送栅障规约包;根节点在接收到其所有子节点发送的栅障规约包后,向其子节点发送栅障分发包;中间节点接收到栅障分发包后,向其子节点发送栅障分发包;叶子节点在接收到栅障分发包后,继续执行子任务代码。本发明能够节省硬件逻辑资源,并能减少栅障同步操作占用的带宽。
-
公开(公告)号:CN101159687A
公开(公告)日:2008-04-09
申请号:CN200710176959.0
申请日:2007-11-07
Applicant: 中国科学院计算技术研究所
Abstract: 本发明公开了一种多通道通信传输数据的系统和装置与方法。该系统包括多个节点和多个交换机,节点包括有多个网络接口,多个网络接口输出连接到所述多个交换机;多个交换机构成物理上独立的多层互连网络,组成从节点到节点间的多个通道;节点用于通过多个交换机组成的具有多个通道的互连网络向目标地址发送消息;节点还用于接收目标地址为自身的通过多个通道的互连网络发送来的数据。其减少了数据传输的延时,增加了网络带宽。
-
公开(公告)号:CN101115008A
公开(公告)日:2008-01-30
申请号:CN200710120753.6
申请日:2007-08-24
Applicant: 中国科学院计算技术研究所
IPC: H04L12/56
Abstract: 本发明公开了一种基于信誉的流量控制系统、装置和方法。该系统包括多端口交换机装置。交换机装置包括多个端口模块,仲裁模块和路由模块;端口模块包括发送模块,接收模块和流控模块;接收模块包括多个虚通道接收缓存区。仲裁模块还包括记录子模块,用于根据传输请求记录仲裁失败FPL值;流控模块还包括判断子模块,用于当接收端的发送模块有数据包发送给发送端的接收模块时,接收端的流控模块根据接收到发送端的发送模块发送来的仲裁失败FPL值,与当前接收端的剩余本地信誉值和当前资源剩余相比较,判断是否发送流控包给发送端的接收模块。其提高了数据通信网络的流量控制方法的效率,并提高了交换网络中链路和缓存区资源的利用率。
-
公开(公告)号:CN1300971C
公开(公告)日:2007-02-14
申请号:CN200410002290.X
申请日:2004-01-16
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及数字通信技术领域,特别是一种基于双8b/10b编码器的16b/20b编码器逻辑实现方法,在两个8b/10b编码器基础上构造16b/20b编码器,解决了直接由两个8b/10b编码器构成16b/20b编码器用于DDR数据源时的时序紧张问题。在使用很少一部分逻辑资源的条件下,简洁地实现了8b/10b编码器的游程偏移预测,避免了使编码器单元成为整体逻辑的关键路径的情况,同时保证双沿数据的8b/10b游程规范性。本发明提出的利用预测的游程偏移作为8b/10b编码器的游程偏移输入端来强制控制8b/10b编码器的输出编码极性的方案,可以类推到更大规模的8b/10b编码生成集的实现。
-
公开(公告)号:CN119356738A
公开(公告)日:2025-01-24
申请号:CN202411452516.X
申请日:2024-10-17
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供了一种基于混合积的任务处理方法及计算装置,该方法包括:获取计算任务所需的第一矩阵A、第二矩阵B和第三矩阵C,计算任务是求AB+C的结果矩阵D的矩阵乘加运算;获取硬件规模t;根据硬件规模和预设的划分规则,将A、B和C分别划分为适于处理阵列处理的四级子矩阵,包括第一、第二、第三和第四级子矩阵;利用处理阵列根据划分出的子矩阵进行混合积运算以完成任务,其中,混合积运算过程中,在第四级子矩阵的维度上采用哈达玛积的形式进行计算,在第三级子矩阵的维度上采用矩阵的外积的形式进行计算,在第二级子矩阵的维度上采用矩阵的外积的形式进行计算,在第一级子矩阵的维度上采用内积的形式进行计算。
-
公开(公告)号:CN119226225A
公开(公告)日:2024-12-31
申请号:CN202411288815.4
申请日:2024-09-14
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供了一种数据流可重构架构中单元失效的自感知方法,所述数据流可重构架构是指能按照任务的数据流对处理单元进行组织和管理的CGRA架构,所述数据流可重构架构包括自感知控制器和多个处理单元,每个处理单元包括计算部件、路由部件和存储部件,路由部件包括控制路由和数据路由,每个部件均设有感知模块,所述方法包括:由所述自感知控制器向处理单元发出检测请求;由处理单元中的各个感知模块根据检测请求分别检测计算部件、存储部件、控制路由和数据路由是否正常,得到检测结果;由自感知控制模块收集各个处理单元反馈的检测结果。
-
公开(公告)号:CN119166218A
公开(公告)日:2024-12-20
申请号:CN202411190236.6
申请日:2024-08-28
Applicant: 中国科学院计算技术研究所
Abstract: 本发明实施例提供一种基于RISC‑V扩展指令的矩阵及向量运算装置,所述装置包括相互连接的协处理器与主处理器,主处理器中配置有RISC‑V指令集和协处理器扩展指令集,RISC‑V指令集包括与向量运算任务相关的向量扩展指令集,协处理器扩展指令集包括与矩阵运算任务相关的矩阵处理指令集,主处理器被配置为:在执行计算任务时,将与矩阵运算任务相关的矩阵处理指令集或将与向量运算任务相关的向量扩展指令集发送给协处理器,以与协处理器并行执行计算任务;协处理器被配置为:根据所述矩阵扩展指令集执行主处理器卸载下的矩阵运算任务,得到矩阵运算任务的执行结果;或者根据所述向量扩展指令集执行主处理器卸载下的向量运算任务,得到向量运算任务的执行结果。
-
公开(公告)号:CN119065832A
公开(公告)日:2024-12-03
申请号:CN202411019358.9
申请日:2024-07-29
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供了一种面向数据流众核处理器的任务运行时调度方法及装置,该方法包括在运行时环境中执行以下操作:根据PE阵列的剩余资源、片上存储空间剩余资源和各任务的属性信息,从任务发射队列中标记资源适配的任务以构建任务组;对任务组中的任务进行预处理,得到经预处理的任务组,将经预处理的任务组映射到PE阵列上执行,其中,所述预处理包括:识别任务组中具有数据依赖的两个任务构成的关联对,修改关联对中前驱任务和后继任务所对应的微指令代码,以使处理该前驱任务的PE核将结果数据直接传输至处理该后继任务的PE核。
-
公开(公告)号:CN116722884A
公开(公告)日:2023-09-08
申请号:CN202310078726.6
申请日:2023-02-08
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种支持远程数据直接访问协议的网络接口,包括支持远程数据直接访问协议的网络接口,其特征在于,该网络接口包括:控制管理模块,用于对RDMA通信过程进行管理,RDMA通信包括基于RDMA可靠连接模式的RDMA可靠连接通信;上下文信息管理模块,用于对RDMA通信过程在网络接口的缓存中维护的连接上下文信息进行管理,其中,在根据预设的聚合规则确定基于RDMA可靠连接模式的多个原生连接所对应的多条原生连接上下文信息是可聚合的情况下,采用聚合连接上下文信息代替可聚合的多条原生连接上下文信息,以减少对网络接口的缓存空间占用;数据传输模块,用于根据原生连接上下文信息或者聚合连接上下文信息执行RDMA可靠连接通信的数据传输过程。
-
-
-
-
-
-
-
-
-