-
公开(公告)号:CN105930902B
公开(公告)日:2018-08-10
申请号:CN201610240416.X
申请日:2016-04-18
Applicant: 中国科学院计算技术研究所
Abstract: 本发明适用于计算机技术领域,提供了一种神经网络处理系统的处理方法、系统,该神经网络的处理系统包括由多个核心处理模块组成的多核心处理模块、片上存储介质、片内地址索引模块以及ALU模块,多核心处理模块用于执行神经网络运算中的向量乘加操作,ALU模块用于从所述多核心处理模块或片上存储介质获取输入数据执行多核心处理模块无法完成的非线性运算,其中多个核心处理模块共享片上存储介质以及ALU模块,或者多个核心处理模块具有独立的片上存储介质以及ALU模块。本发明在神经网络处理系统中引入多核设计,从而提升神经网络处理系统的运算速度,使得神经网络处理系统性能更高,更加高效。
-
公开(公告)号:CN107632965A
公开(公告)日:2018-01-26
申请号:CN201710967772.6
申请日:2017-10-17
Applicant: 中国科学院计算技术研究所
Abstract: 本公开提供一种可重构的S形运算装置和方法,其中装置包括:运算部分,用于完成运算,包含多个运算单元组,多个所述运算单元组呈X行Y列的阵列式分布,运算单元组间以S形方向和/或逆S形方向传递数据,其中X和Y分别为正整数。通过采用S形和逆S形在运算单元中完成数据的传递,从而能够有效加速神经网络运算的同时,降低了权值的反复读取和部分和反复存取所带来的访存功耗。
-
公开(公告)号:CN105912476A
公开(公告)日:2016-08-31
申请号:CN201610210095.9
申请日:2016-04-06
Applicant: 中国科学院计算技术研究所
IPC: G06F12/06 , G06F12/0831
CPC classification number: G06F12/06 , G06F12/0653 , G06F12/0831
Abstract: 本发明提供一种片上重复寻址的方法及其相应的装置,该方法包括:数据划分步骤,根据预定的数据划分原则将片上存储介质和/或片外存储介质的数据划分为不同的数据块,所述数据划分原则包括将重用距离低于预定距离阈值的数据划分在同一个数据块;数据索引步骤,根据预定的替换策略的顺序关系,依次载入不同的所述数据块到至少一个片上处理单元,被载入的所述数据块中的重复数据在片内重复寻址。本发明将重用距离小于预定的距离阈值的数据划分在同一个数据块,这些数据划分在同一数据块上可以一次载入片内存储然后使用尽可能多的次数,从而访存更加高效。
-
公开(公告)号:CN119740663A
公开(公告)日:2025-04-01
申请号:CN202411809841.7
申请日:2024-12-10
Applicant: 中国科学院计算技术研究所
IPC: G06N5/04
Abstract: 本发明提出一种基于拓扑计算的大模型推理计算架构,包括:CPU、SDRAM、代码存储器、提示词存储器,以及大模型推理加速器,并通过总线将该CPU、该SDRAM、该代码存储器、该提示词存储器及该大模型推理加速器进行路由连接;进行大模型推理计算时,首先将该代码存储器中的代码及该提示词存储器中的提示词和词表,读取至该SDRAM,再根据该提示词的标记ID查询该SDRAM中的词表以获取嵌入向量,然后将该嵌入向量发送给该大模型推理加速器进行大模型推理计算,将该大模型推理加速器获得的输出结果发送上位机。本发明还提出一种基于拓扑计算的大模型推理计算方法及装置。本发明解决了大模型推理过程中权值加载的开销过大及KV cache的SRAM实现面积开销过大的问题。
-
公开(公告)号:CN119313952A
公开(公告)日:2025-01-14
申请号:CN202411342753.0
申请日:2024-09-25
Applicant: 中国科学院计算技术研究所
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06V20/10 , G06N3/0464 , G06N3/0455 , G06N3/094
Abstract: 本发明提出一种高光谱遥感图像分类方法、装置、存储介质,该方法包含:获取待测高光谱遥感图像的源域数据集与目标域数据集,该源域数据集的样本量大于该目标域数据集;分别对该源域数据集与目标域数据集进行多尺度中心样本信息增强处理,得到第一多尺度中心样本集、第二多尺度中心样本集;将该第一多尺度中心样本集输入至分类模型进行预训练,该分类模型包含分支融合网络,用以执行特征融合处理,输出融合的空谱特征;将预训练后的分类模型迁移至该第二多尺度中心样本集,执行轻量化微调处理,该分类模型输出最终的目标分类结果。该方法在参数量少的情况下达到了优异的分类效果,提高了高光谱遥感图像的分类准确性。
-
公开(公告)号:CN119026543A
公开(公告)日:2024-11-26
申请号:CN202411121715.2
申请日:2024-08-15
Applicant: 中国科学院计算技术研究所
IPC: G06F30/3315 , G06F30/3312 , G06F30/3953 , G06N20/00
Abstract: 本申请公开了一种布线前静态时序分析方法及其装置,方法包括:将布线前的集成电路进行基于图的建模,将电路进行网络划分,输出电路的网络级建模结果;从布线前电路数据中提取网络延迟预测特征集;根据网络延迟预测特征集,采用分布式梯度增强库,构建网络延迟预测模型,输出不同工作条件下的网络延迟预测结果;基于网络级建模结果及各工作条件下的网络延迟预测结果,采用线性复杂度算法计算到达时间及松弛,输出最终的布线前静态时序分析结果。本发明在多设计模式下以高精度一致地获得静态时序分析结果,本发明方法具有鲁棒的可泛化性。
-
公开(公告)号:CN118468966A
公开(公告)日:2024-08-09
申请号:CN202410647057.4
申请日:2024-05-23
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种串行压缩单元、深度神经网络加速器,该加速器的每一处理元件包含串行压缩单元与计算单元,其中:该串行压缩单元包含异步电路握手模块与锁存模块,相邻串行压缩单元的异步电路握手模块彼此之间串行连接,且每一异步电路握手模块由一握手信号控制,相邻二异步电路握手模块之间连接一延时匹配模块;相邻串行压缩单元的锁存模块彼此之间串行连接,且每一锁存模块对应连接异步电路握手模块,且于接收该异步电路握手模块输出的使能信号时被触发,每一锁存模块由该使能信号控制。该加速器性能与能效显著提高。
-
公开(公告)号:CN118394482A
公开(公告)日:2024-07-26
申请号:CN202410647061.0
申请日:2024-05-23
Applicant: 中国科学院计算技术研究所
IPC: G06F9/48
Abstract: 本发明提出一种基于AI处理器板卡任务调度的AI任务执行加速方法和装置,包括:获取待执行的AI任务,并在该AI任务中增加调度策略配置参数;具有多个AI处理器板卡的AI计算平台根据该调度策略配置参数,确定执行该AI任务的AI处理器板卡ID;将该AI任务的运行在该AI处理器板卡ID对应的AI处理器板卡上,得到该AI任务的执行结果。从而可以达到更高效地利用AI处理器的效果;在该调度机制中,用户可以在配置文件中灵活地设置调度策略;调度策略包括内存占用最少优先、计算利用率最低优先和智能调度策略。
-
公开(公告)号:CN117991628A
公开(公告)日:2024-05-07
申请号:CN202211378151.1
申请日:2022-11-04
Applicant: 中国科学院计算技术研究所
IPC: G05B13/04 , G06N3/045 , G06N3/0499 , G06N3/048 , G06N3/092
Abstract: 本发明提出一种基于上下文符号策略的元强化学习自动控制方法和系统,包括:将基础控制对象的运动轨迹的上下文变量输入参数生成器,得到上下文变量中所有动作维度在符号网络中的预测参数;路径选择器通过在预测参数上乘以二进制掩码,以从符号网络中选择代表符号表达式形式的路径;符号网络根据路径和预测参数,生成训练样本的预测控制策略;使用预测控制策略控制基础控制对象,根据其运动轨迹使用强化学习训练更新参数生成器和路径选择器;将目标控制对象的上下文变量输入训练完的路径选择器和参数生成器,得到符号网络的结构和参数,从而得到目标控制对象符号化的控制策略,以控制策略控制目标控制对象完成控制目标。
-
公开(公告)号:CN117935868A
公开(公告)日:2024-04-26
申请号:CN202410111561.2
申请日:2024-01-26
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种随机递增存储器,其包含:多个偏斜单元,配置为将一元比特流存储为偏斜数格式;至少一计算单元,配置为对所述多个偏斜单元存储的偏斜数进行递增操作。本发明还提出一种脉动随机递增存储器体系结构,其包含多路存储器;每一路存储器包含:多个一元处理单元,呈多行排列分布;多个随机递增存储器,同一行的一元处理单元配置一随机递增存储器;多路存储器之间由边缘部件隔开。该随机递增存储器能够将一元比特流累加为偏斜数格式,并与脉动阵列结构集成为脉动随机递增存储器体系结构,以降低累加能耗,提升能效。
-
-
-
-
-
-
-
-
-