-
公开(公告)号:CN116861359A
公开(公告)日:2023-10-10
申请号:CN202310643920.4
申请日:2023-06-01
Applicant: 中国科学院计算技术研究所
IPC: G06F18/25 , G06N3/0464 , G06N3/08
Abstract: 本发明提出一种面向深度学习推理任务编译器的算子融合方法,包括:将深度学习推理任务模型的标准模型,转化为初始图级IR;遍历该初始图级IR,将该初始图级IR中的可融合算子标识为同类算子或异类算子;将该初始图级IR转化为张量表达式,融合该张量表达式中的同类算子;将该张量表达式编译为内核源码,融合该内核源码中的异类算子;将该内核源码编译为可执行代码并部署运行。本发明还提出一种面向深度学习推理任务编译器的算子融合系统,以及一种用于深度学习推理任务编译器算子融合的数据处理装置。
-
公开(公告)号:CN114265805A
公开(公告)日:2022-04-01
申请号:CN202111587285.X
申请日:2021-12-23
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供了一种PCIe交换芯片上、下游游端口路由表构建方法,用于构建上、下游端口路由表,所述方法包括:在上游端口重复执行如下步骤直至完成上游端口到所有下游端口的路由表项构建:S1、上游端口捕获与其相连的操作系统下发的与下游端口路由相关的配置包;S2、解析所述配置包中与路由相关的信息并根据解析到的路由相关信息构建上游端口路由表项;在下游端口重复执行如下步骤直至完成下游端口到其他下游端口的路由表项构建:P1、下游端口接收上游端口捕获的与其相连的操作系统下发的与下游端口路由相关的配置包;P2、解析所述配置包中与路由相关的信息并根据解析到的路由相关信息构建下游端口路由表项。
-
公开(公告)号:CN110990063B
公开(公告)日:2021-11-23
申请号:CN201911191604.8
申请日:2019-11-28
Applicant: 中国科学院计算技术研究所
Abstract: 本发明实施例提供了一种用于基因相似性分析的加速装置、方法和计算机设备,该加速装置包括高速通信接口,用于与主机通信,接收主机分发的待加速处理的任务;序列缓存模块,用于缓存来自主机的一个或者多个任务,每个任务包含待进行基因相似性分析的多个基因序列数据;阵列处理机,其上设有用于处理任务的处理单元,处理单元中设有基于数据驱动的流式计算模式处理任务的完整流水线,流水线中配置有处理任务所需的多个定点计算部件;控制模块,其被配置为用于将序列缓存模块中的待处理的任务分配给处理单元;任务缓存模块,其上设置有任务缓存单元,用于缓存分配给处理单元的待处理任务。本发明能够提高基因相似性分析的效率,快速得到分析结果。
-
公开(公告)号:CN113504874A
公开(公告)日:2021-10-15
申请号:CN202110703033.2
申请日:2021-06-24
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种基于负载感知的自适应粒度纠删码编解码加速方法及系统。通过针对当前节点的编解码负载判断当前节点的计算压力,根据计算压力,区分当前的优化方向,在面向低负载时,根据最佳切分粒度分布图进行数据切分和计算,在面向高负载时,则根据任务压力进行自适应的粒度聚合。
-
公开(公告)号:CN111290767B
公开(公告)日:2021-06-08
申请号:CN202010063953.8
申请日:2020-01-20
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种具有业务快速恢复功能的容器组更新方法及系统,包括:根据对容器组的更新请求,暂停该容器组的服务,通过比较更新请求和容器组当前状态,确定该容器组中待更新容器,并将该容器组中除该待更新容器以外的容器全都暂停,并将除该待更新容器以外的容器的进程持久化到磁盘;保存该待更新容器的运行状态,根据该更新请求中需要更新的容器镜像文件构建新的容器镜像,销毁该待更新容器后根据该运行状态重新运行新的容器镜像,得到更新容器,恢复运行该容器组以完成对该容器组的更新。
-
公开(公告)号:CN109376855B
公开(公告)日:2021-04-06
申请号:CN201811532813.X
申请日:2018-12-14
Applicant: 中国科学院计算技术研究所
IPC: G06N3/067
Abstract: 本发明提供一种光神经元结构和包含该结构的神经网络处理系统。该神经元结构包括突触输入调制模块、突触权值调制模块、光线聚合模块和光强度探测模块,其中,突触输入调制模块用于接收光信号并在与输入神经元关联的电信号的控制下执行光路调制;突触权值调制模块用于在与权值关联的电信号控制下执行对所述承载输入神经元的光信号进行调制;光线聚合模块用于对多个突触权值调制模块的输出光信号进行聚合;光强度探测模块用于将来自于光线聚合模块的输出光信号转换为电信号并执行激活操作。本发明的光神经元结构和包含该结构的神经网络处理系统能够实现神经网络的快速计算。
-
公开(公告)号:CN111680797A
公开(公告)日:2020-09-18
申请号:CN202010381206.9
申请日:2020-05-08
Applicant: 中国科学院计算技术研究所
IPC: G06N3/12
Abstract: 本发明实施例提供了一种DNA活字印刷机、基于DNA的数据存储设备和方法,所述DNA活字印刷机包括:PCR反应区,用于通过PCR反应将获取的多种DNA活字序列按序连接为表示二进制信息的DNA序列,其中,每种DNA活字序列是根据预定的映射规则预先合成的单链DNA片段,所述预定的映射规则用于定义特定的多位二进制码与特定的碱基序列之间的映射关系,每个单链DNA片段中包含与某个特定的多位二进制码对应的碱基序列;PCR产物纯化区,用于对经过PCR反应的产物进行纯化;机械臂;以及机械臂控制模块,用于控制所述机械臂以获取所述DNA活字序列,以及控制所述机械臂作为PCR反应区的产物和PCR产物纯化区的产物的转移工具,本发明能够提供高效和高性价比的DNA存储。
-
公开(公告)号:CN109067662B
公开(公告)日:2020-09-01
申请号:CN201810700993.1
申请日:2018-06-29
Applicant: 中国科学院计算技术研究所
IPC: H04L12/801 , H04L12/721
Abstract: 本发明涉及一种基于作业部署信息的链路互连方法和系统,包括:获取待运行的作业,为当前作业的分配多个计算节点,获取与计算节点相连的交换节点间的通信概率总和,以及交换节点间的路由路径经过除当前作业以外的其余作业的路由路径数量,根据通信概率总和、路由路径数量,得到多个交换节点间的加权距离;根据多个计算节点的计算资源是否连续,将交换节点间最大加权距离对应的交换节点进行互连。由此本发明解决由于作业部署问题所带来的远距离热点通信问题,对影响网络性能的通信热点准确进行识别,避免对作业与作业间无关交换节点的计算,能更快速地得到互连结果。
-
公开(公告)号:CN107465966B
公开(公告)日:2020-06-05
申请号:CN201710767900.2
申请日:2017-08-31
Applicant: 中国科学院计算技术研究所
IPC: H04Q11/00 , H04L12/751
Abstract: 本发明提供一种用于光网络的拓扑重构控制方法,包括:1)获取光网络为各个网络节点之间的线路所提供的带宽,以生成当前带宽矩阵;2)获取应用场景中各个网络节点之间的负载要求,以生成需求矩阵;3)对所述当前带宽矩阵与所述需求矩阵进行比较,若所述当前带宽矩阵不满足所述需求矩阵,则执行拓扑重构。
-
公开(公告)号:CN107066706B
公开(公告)日:2019-07-30
申请号:CN201710186589.2
申请日:2017-03-27
Applicant: 中国科学院计算技术研究所
IPC: G06F17/50
Abstract: 本涉及一种GPU FFMA指令在双发射模式下的通量测试方法和系统,其中该测试方法包括对GPU指令的延迟和通量进行测试,获得该GPU指令的延迟周期和GPU指令通量;根据判断寄存器间是否存在bank冲突,选取无bank冲突的寄存器操作数;通过该GPU指令的延迟周期和GPU指令通量,分析测试该GPU指令中控制码的含义,并根据该控制码的含义,控制开启对应的发射模式和GPU的线程调度,若开启的发射模式为双发射模式,则根据该双发射模式和该寄存器操作数计算测试GPU浮点乘加指令在双发射模式下的通量。本发明通过微基准测试程序测试出GPU参数以及其和性能的对应关系,得出参数和性能的关系,有助于优化GPU上的应用。
-
-
-
-
-
-
-
-
-