-
公开(公告)号:CN117850987A
公开(公告)日:2024-04-09
申请号:CN202211213164.3
申请日:2022-09-30
Applicant: 华为技术有限公司 , 中国科学技术大学苏州高等研究院
Abstract: 本申请实施例提供了一种任务处理方法和装置,能够解决任务处理的过程中端到端时延不确定的问题,能够适用于对端到端时延有确定性需求的场景,更符合工控、车、第五代通信技术与产业互联网等业务领域的要求,从而提高用户体验。上述方法包括:获取目标任务的有向无环图DAG、目标任务的端到端时延需求和至少一个处理器核心的标识,目标任务包括多个子任;将DAG、端到端时延需求和至少一个处理器核心的标识输入至任务模型,得到多个子任务更新后的时间信息和多个子任务中每个子任务对应的处理器核心,时间信息包括启动时间和处理时间,任务模型中包括预先设置的算法;按照更新后的时间信息在对应的处理器核心上处理多个子任务。
-
公开(公告)号:CN116343009A
公开(公告)日:2023-06-27
申请号:CN202310329084.2
申请日:2023-03-28
Applicant: 国网浙江省电力有限公司电力科学研究院 , 中国科学技术大学苏州高等研究院 , 国网浙江省电力有限公司宁波供电公司
IPC: G06V10/82 , G06N3/0495 , G06N3/0464 , G06N3/045
Abstract: 本发明公开了三维神经网络处理方法及图像处理方法、系统和存储介质,属于神经网络以及图像处理技术领域。本发明的一种基于分块循环矩阵的三维神经网络处理方法,通过构建分块循环矩阵模型、计算加速模型、全频域模型,克服以往剪枝等模型压缩方法存在的访存、计算不规则等问题,提出使用分块循环矩阵对三维神经网络3D CNN进行压缩,并且进一步利用快速傅立叶变换FFT加速计算,在保持模型结构规则的前提下,取得了显著的存储和计算压缩效果。在此基础上,引入频域内的激活、批归一化和池化操作,进一步消除由于快速傅立叶变换FFT带来的频繁的时域/频域切换开销,从而实现了全频域计算,进一步降低了3D CNN模型推理时的计算开销。
-
公开(公告)号:CN114897150B
公开(公告)日:2023-04-07
申请号:CN202210347712.5
申请日:2022-04-01
Applicant: 中国科学技术大学苏州高等研究院
IPC: G06N3/063 , G06F8/61 , G06F30/398
Abstract: 本发明公开了一种AI智能模组的可靠性设计方法,所述AI智能模组包括智能处理单元及其连接的内存单元、电源单元、以太网接口单元、PCIE接口单元、温度监测单元以及电流监测单元。此AI智能模组可以通过千兆网接口和PCIE高速接口,传输图像、视频等其他数据进行相关AI算法的加速处理,如图像增强、图像分类、目标检测、目标识别、目标跟踪等。本发明的AI智能模组的可靠性设计方法主要包含三类,一类是基于硬件电路限流保护的方法,一类是基于软件程序上注更新的方法,还有一类是基于软看门狗、重启指令的方法。一般来说,为完成上述三类方法的技术实现,还需要配套的辅助控制底板,如FPGA、CPLD等来共同完成。
-
公开(公告)号:CN114897150A
公开(公告)日:2022-08-12
申请号:CN202210347712.5
申请日:2022-04-01
Applicant: 中国科学技术大学苏州高等研究院
IPC: G06N3/063 , G06F8/61 , G06F30/398
Abstract: 本发明公开了一种AI智能模组的可靠性设计方法,所述AI智能模组包括智能处理单元及其连接的内存单元、电源单元、以太网接口单元、PCIE接口单元、温度监测单元以及电流监测单元。此AI智能模组可以通过千兆网接口和PCIE高速接口,传输图像、视频等其他数据进行相关AI算法的加速处理,如图像增强、图像分类、目标检测、目标识别、目标跟踪等。本发明的AI智能模组的可靠性设计方法主要包含三类,一类是基于硬件电路限流保护的方法,一类是基于软件程序上注更新的方法,还有一类是基于软看门狗、重启指令的方法。一般来说,为完成上述三类方法的技术实现,还需要配套的辅助控制底板,如FPGA、CPLD等来共同完成。
-
公开(公告)号:CN113033082A
公开(公告)日:2021-06-25
申请号:CN202110258488.8
申请日:2021-03-10
Applicant: 中国科学技术大学苏州高等研究院
IPC: G06F30/27 , G06N20/20 , H04L29/08 , G06F111/08
Abstract: 本发明公开了一种基于异构算力感知的去中心化联邦学习框架,包括云端协调器和若干设备端;所述云端协调器用于运行时管理、训练和参数更新方案生成、定期模型备份;所述设备端用于向云端协调器传输设备信息,在本地运行模型,更新设备端参数;所述云端协调器获取设备端一次训练时间的最小公倍数为超周期,设备端在超周期内计算不同的步长,在超周期的整数倍时聚合模型。根据设备计算能力不同而运行不同的本地步骤,在模型聚合过程中,为了减少慢节点的负面影响;采用了分布式的点对点通信方式,可以在不增加整体通信量的情况下,消除在分布式训练过程中中央服务器的通信压力。
-
公开(公告)号:CN119598079A
公开(公告)日:2025-03-11
申请号:CN202411726882.X
申请日:2024-11-28
Applicant: 中国科学技术大学苏州高等研究院 , 中国科学技术大学
Abstract: 本发明涉及计算机技术领域,公开了一种位级可组合加速器的设计方法、设备、介质及产品。该方法包括:对待设计加速器进行位级可组合硬件建模,获取位级可组合硬件结构;根据位级可组合硬件结构,通过融合软硬件参数化描述进行位级数据流建模,获取数据流描述参数;根据数据流描述参数建立设计空间,并通过对设计空间进行最佳设计点搜索,获取目标数据流。本实施例的方案,通过进行位级可组合硬件建模、位级数据流建模和硬件调度设计搜索,可以为加速器的硬件设计和数据调度设计增加位级计算支持,可以为硬件和调度设计提供定量评估和自动化指导,可以实现自动的位级可组合加速器的硬件设计和调度优化。
-
公开(公告)号:CN118690824B
公开(公告)日:2024-12-31
申请号:CN202411186366.2
申请日:2024-08-28
Applicant: 中国科学技术大学苏州高等研究院 , 中国科学技术大学
IPC: G06N3/0895 , G06N3/0455
Abstract: 本发明提供了一种性能预测模型的训练方法及装置、性能预测方法及装置,应用于数据处理技术领域。性能预测模型的训练方法包括:利用目标计算单元对无标签神经网络结构数据执行掩码处理任务,得到可见节点特征矩阵、掩码节点特征矩阵和掩码标识矩阵;利用目标计算单元对掩码标识矩阵执行预测任务,得到述掩码标识矩阵的预测隐空间特征;利用目标计算单元对掩码节点特征矩阵执行编码任务,得到掩码节点特征矩阵的隐空间特征;利用目标计算单元对掩码标识矩阵的预测隐空间特征和掩码节点特征矩阵的隐空间特征执行损失计算任务,得到第一目标损失值;基于第一目标损失值,利用目标计算单元对性能预测模型执行训练任务,得到训练后的性能预测模型。
-
公开(公告)号:CN118467313A
公开(公告)日:2024-08-09
申请号:CN202410605215.X
申请日:2024-05-15
Applicant: 中国科学技术大学苏州高等研究院 , 中国科学技术大学
IPC: G06F11/34 , G06N3/04 , G06F18/25 , G06F18/213
Abstract: 本发明公开了一种基于芯粒特性感知的硬件建模方法及装置,包括:获取每个芯粒的芯粒信息,对每个芯粒的芯粒信息执行预处理操作得到每个芯粒的芯粒特性信息;基于所有芯粒的芯粒特性信息,生成第一任务集合,并确定第一任务集合对应的第一任务集特征;基于所有芯粒的芯粒特性信息,生成第二任务集合,并确定第二任务集合对应的第二任务集特征;对第一任务集特征以及第二任务集特征执行特征融合操作,得到目标特征向量,基于目标特征向量执行硬件建模操作得到目标模型。可见,实施本发明能够基于芯粒特性感知智能化进行硬件建模,能够对多芯片的性能进行建模和分析,有利于提高硬件建模的准确性和可靠性以及有利于提高硬件建模的智能性和效率。
-
公开(公告)号:CN116933640A
公开(公告)日:2023-10-24
申请号:CN202310916207.2
申请日:2023-07-25
Applicant: 中国科学技术大学苏州高等研究院 , 上海处理器技术创新中心
Abstract: 本发明公开了一种基于黑盒分析的硬件资源建模方法。该方法包括:基于一般性能表征和特殊性能表征对硬件资源进行建模;其中,所述一般性能表征由根据神经网络特征拟合模型推理延迟的参数向量构成;所述特殊性能表征由根据多设备间相关系数低于设定阈值的神经网络推理延迟向量构成。本发明针对存在多维异构的智能推理设备,构建了一种基于黑盒分析的硬件资源建模方法,实现了对异构设备的统一建模分析,能够有效区分异构设备的DNN推理性能差异。
-
公开(公告)号:CN116663629A
公开(公告)日:2023-08-29
申请号:CN202310782272.0
申请日:2023-06-29
Applicant: 国网浙江省电力有限公司电力科学研究院 , 中国科学技术大学苏州高等研究院
IPC: G06N3/063 , G06N3/0464
Abstract: 本发明公开了一种促进神经网络加速计算的方法,涉及神经网络技术领域,用于解决现有神经网络计算分配时特征不匹配的问题,该方法包括以下步骤:获取神经网络运行参数;根据所述运行参数,计算神经网络各层仿存比;根据访存比计算结果对所述神经网络进行分组,将访存比差值在预设区间内的层分入同组;将分入同组的层分配给同一处理引擎。本发明还公开了一种神经网络计算加速装置及电子设备。本发明通过访存比对神经网络层进行分组,并匹配合适的处理引擎,使得神经网络计算分配时特征匹配,性能优。
-
-
-
-
-
-
-
-
-