-
公开(公告)号:CN100571183C
公开(公告)日:2009-12-16
申请号:CN200710120754.0
申请日:2007-08-24
Applicant: 中国科学院计算技术研究所
Abstract: 本发明公开了基于胖树拓扑的屏障(Barrier)操作网络系统、装置及方法。该系统包括在多处理机系统的数据互联网络中,使用交换机节点作为屏障树的根,处理机节点作为屏障树的叶子。交换机节点包括屏障模块,用于归约和分发的过程中。保证屏障操作的可靠性方面,对接收屏障归约包采用应答方式,对接收屏障分发包,采用催促方式。通过单比特标识的方式,对多次屏障操作进行区分。通过出错率统计,获取当前交换机的链路出错率,自动对超时重传参数进行调整。其保证了网络传输的可靠性,提高了网络传输的效率即低延迟性,达到功能和性能的双重保证。
-
公开(公告)号:CN101115053A
公开(公告)日:2008-01-30
申请号:CN200710120756.X
申请日:2007-08-24
Applicant: 中国科学院计算技术研究所
Abstract: 本发明公开了一种信誉流量控制方法,包括:当所要发送数据包的大小小于远端信誉值计数器中的信誉值时,发送所述数据包,并执行下一步,否则,不发送所述数据包;根据所发送数据包的大小,减少远端信誉值计数器中的信誉值;接收数据包,并减少所述本地信誉值计数器中的信誉值;对下一个数据包的长度进行预测;根据预测结果,信誉值,以及接收缓冲区空闲空间的大小,决定是否需要发送包含有新信誉值的流控包。本发明不会盲目发送流控信息,只会根据当前数据流情况,自适应的在链路恰好需要流控信息时发送有效流控包,以保证数据流不断流,从而提高物理链路和缓冲区资源利用率。
-
公开(公告)号:CN118132462A
公开(公告)日:2024-06-04
申请号:CN202410263613.8
申请日:2024-03-08
Applicant: 中国科学院计算技术研究所
IPC: G06F12/0811 , G06F12/0866 , G06F15/78
Abstract: 本发明提供了一种数据流众核处理器的数据预取方法及处理器,方法包括:对于待执行的程序,将程序执行所需的数据划分为可预取数据和不可预取数据;对于可预取数据,在程序执行前加载至处理器的片上存储,且在程序执行前将片上存储中存有所述可预取数据的缓存路设为不可被覆盖的只读状态;对于不可预取数据,在程序执行过程中按需加载至片上存储,有效地减少了对片外存储的访问请求次数,降低了平均访问延迟;并且在程序执行前将片上存储中存有所述可预取数据的缓存路设为不可被覆盖的只读状态,使得可预取数据在程序执行完毕前被稳定地保持在片上存储中。
-
公开(公告)号:CN113298236B
公开(公告)日:2023-07-21
申请号:CN202110676008.X
申请日:2021-06-18
Applicant: 中国科学院计算技术研究所
IPC: G06N3/0464 , G06N3/063
Abstract: 本发明提供一种基于数据流结构的低精度神经网络计算装置,包括输入缓存区,输出缓存区、权重缓存区以及PE阵列,其中,PE阵列中的每个PE包括乘加部件,所述乘加部件以SIMD方式进行乘加运算。本发明还提供一种基于上述装置的低精度神经网络加速方法。本发明节省了计算资源,减少了访存带来的开销。
-
公开(公告)号:CN115686639A
公开(公告)日:2023-02-03
申请号:CN202211290962.6
申请日:2022-10-21
Applicant: 中国科学院计算技术研究所
IPC: G06F9/38
Abstract: 本发明提供了一种应用于处理器的分支预测方法以及分支预测器,该分支预测方法包括:获取TAGE预测器对分支指令进行分支预测的第一中间参数以及第一预测值;获取GEHL预测器对所述分支指令进行分支预测的第二中间参数以及第二预测值;利用预设的组合预测器根据所述分支指令对应的PC值、第一中间参数、第一预测值、第二中间参数以及第二预测值中的指定比特位按照预定的规则重组确定多个子索引,并基于重组的多个子索引确定对应的第三预测值以及第三预测值的置信度;根据所述分支指令对应的PC值、第三预测值以及第三预测值的置信度生成查询索引,利用所述查询索引从预定的模式历史表中确定分支指令对应的最终预测值,从而提升分支预测的精度和处理器效率。
-
公开(公告)号:CN113572582A
公开(公告)日:2021-10-29
申请号:CN202110799123.6
申请日:2021-07-15
Applicant: 中国科学院计算技术研究所
IPC: H04L1/18
Abstract: 本发明公开了一种数据发送控制方法,包括以下步骤:步骤1、发送控制模块通过系统总线模块从内存模块中读取待发送数据,并将所述待发送数据封装为网络数据包;步骤2、所述发送控制模块从元数据模块中获取缓冲区模块的当前状态来判断所述缓冲区模块的存储空间是否已满,若是,则执行步骤3;否则,执行步骤4;步骤3、根据替换算法用所述网络数据包将所述缓冲区模块的数据换出;步骤4、将所述网络数据包写入所述缓冲区模块;步骤5、将所述网络数据包推送到网络中。
-
公开(公告)号:CN111262868B
公开(公告)日:2021-04-06
申请号:CN202010052388.5
申请日:2020-01-17
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种用于智能网卡的消息发送方法和接收方法,其中,所述智能网卡所在节点存储有为所述节点生成的密钥列表,密钥列表包含了该节点与其他节点的共享密钥,其中,系统中每一对节点有一个共享密钥,不同节点对的共享密钥不同,所述发送方法包括:根据待发送的消息生成消息头和消息内容,其中所述消息头包括消息长度信息和发送消息的源节点序号,消息内容以消息键‑消息值对形式表示;基于所述消息头和消息内容以及所述密钥列表生成验证码向量;将所述消息头、消息内容以及验证码向量组成发送消息包发送。所述接收方法采用接收节点对应的密钥列表对接收到的消息进行验证,并将验证通过的消息存储在系统内存的哈希表中。
-
公开(公告)号:CN112311695A
公开(公告)日:2021-02-02
申请号:CN202011134155.6
申请日:2020-10-21
Applicant: 中国科学院计算技术研究所
IPC: H04L12/873 , H04L12/917 , H04L12/933
Abstract: 本发明提出一种片上带宽动态分配方法系统,包括:发射模块接受存储系统的任务请求,将请求封装为发射块,将多个发射块组织为堆结构,动态维护堆结构,向分配模块传输发射块;分配模块由带窗口的队列组成,其功能为接受发射块,为发射块匹配等待队列,更新发射块内容并将其回传存储系统;每个宽度的带宽对应一个等待队列,等待队列中是需要传输的数据。本发明采用硬件与软件协同的方式带宽分配方法,可以提高带宽的利用率,增加芯片的吞吐率,实现高通量的计算需求;本发明控制逻辑、结构简单,不占用计算资源,实现简单,在多种芯片系统中具有普适性。
-
公开(公告)号:CN106844263B
公开(公告)日:2020-07-03
申请号:CN201611215355.8
申请日:2016-12-26
Applicant: 中国科学院计算技术研究所 , 中国科学院国有资产经营有限责任公司
Abstract: 本发明提出一种基于可配置的多处理器计算机系统及实现方法,涉及计算机体系结构技术领域,该系统包括通用计算单元、高性能网络通信接口、基于PCIe的融合互连控制器、I/O单元;其中所述通用计算单元通过所述高性能网络接口接入所述基于PCIe的融合互连控制器,所述I/O单元通过标准的PCIe接口接入所述基于PCIe的融合互连控制器,所述I/O单元通过所述基于PCIe的融合互连控制器被多个所述通用计算单元共享。本发明在高效互连的可配置的多处理器计算机系统架构中,实现了根据应用需要配置通用计算单元、加速计算单元、网络设备、高速存储等的数量和工作模式,进而可以构造优化的系统,达到最优的性能功耗比和性能价格比。
-
-
-
-
-
-
-
-
-