-
公开(公告)号:CN118736368B
公开(公告)日:2024-12-31
申请号:CN202411215740.7
申请日:2024-09-02
Applicant: 中国科学技术大学苏州高等研究院 , 中国科学技术大学
IPC: G06V10/80 , G06V10/771 , G06V10/82 , G06N3/042
Abstract: 本发明提供了一种图数据处理方法及装置,可以应用于数据处理技术领域。该图数据处理方法包括:获取表征图数据的稀疏矩阵,稀疏矩阵包括多个行向量和多个列向量,行向量和列向量均表征图数据的顶点;对稀疏矩阵的行向量进行等值划分,得到多个稀疏分片,每个稀疏分片包括相同数量的非零元素,稀疏矩阵包括非零元素,非零元素表征图数据的不同的顶点之间的边关系;基于矩阵乘法算法将每个稀疏分片中的每个非零元素分别与预设密集矩阵进行数据融合,得到与图数据对应的结构特征,其中,多个非零元素并行与预设密集矩阵进行数据融合。
-
公开(公告)号:CN116912083A
公开(公告)日:2023-10-20
申请号:CN202310897139.X
申请日:2023-07-20
Applicant: 中国科学技术大学苏州高等研究院
IPC: G06T3/00 , G06T7/11 , G06N3/0475 , G06N3/094
Abstract: 本申请公开了一种基于GAN反演的鲁棒自适应图像处理方法,包括:步骤S1:建立基本框架,基本框架作为文本驱动的图像操作,对给定的文本提示t应用相同的编辑操作;步骤S2:GAN反演包括依序进行的:基于元素的EV剪枝、EV微调、LC搜索;步骤S3:建立稳健目标,构建图像的空间结构实现图像合成和语义分割,将多分支生成器集成到框架中,以捕获图像处理的空间局部性;步骤S4:定义图像因编辑而改变的感兴趣区域r;步骤S5:提出CLIP感知损失,放大感兴趣区域的图文相似度,降低外围区域的图文相似度;步骤S6:采用启发式算法去除编辑矢量噪音,同时为当前图像处理找到有意义的编辑向量和有意义的层。该方法图像搜索后能获得更精准的图像到图像映射结果。
-
公开(公告)号:CN116596034A
公开(公告)日:2023-08-15
申请号:CN202310440957.7
申请日:2023-04-23
Applicant: 中国科学技术大学苏州高等研究院
IPC: G06N3/0464 , G06N3/063 , G06N3/084 , G06F15/78 , G06F7/48
Abstract: 本发明公开了一种复数域上的三维卷积神经网络加速器及方法,该加速器包括:缓存单元,所述缓存单元用于存储复数域内的输入特征、输出特征和权重数据;AXI DMA单元,所述AXI DMA单元用于该加速器与片外存储器进行数据传输;计算单元,所述计算单元用于对所述卷积层和全连接层的计算进行加速;后处理单元,所述后处理单元用于计算融合后的量化层、池化层、批归一化层和激活层;控制单元,所述控制单元用于控制和调度所述缓存单元、AXI DMA单元、计算单元和后处理单元的工作状态。其可以显著提升3D CNN部署时的性能和能效。
-
公开(公告)号:CN113900986A
公开(公告)日:2022-01-07
申请号:CN202111213307.6
申请日:2021-10-19
Applicant: 中国科学技术大学苏州高等研究院
Abstract: 本发明公开了一种估算动态重构硬件加速中的性能开销方法和装置。其中,该方法包括:通过调整FPGA的可重构区域生成对应的比特流文件;根据可重构区域包含的资源数估算所述可重构区域比特流文件的大小;根据所述可重构区域比特流文件的大小和FPGA内部配置访问端口速度,确定可重构区域的重构时间。本发明实施例提供的技术方案,通过对可重构区资源的统计分析,可以在不需要实际布局布线即可获得重构开销的估计值,能够在设计帮助设计者在设计初期有效评估可重构设计的合理性,缩短试验周期;通过对比特流文件的解析、比特流格式和配置每列资源帧组织的分析,提高了估算结果的准确性。
-
公开(公告)号:CN118736368A
公开(公告)日:2024-10-01
申请号:CN202411215740.7
申请日:2024-09-02
Applicant: 中国科学技术大学苏州高等研究院 , 中国科学技术大学
IPC: G06V10/80 , G06V10/771 , G06V10/82 , G06N3/042
Abstract: 本发明提供了一种图数据处理方法及装置,可以应用于数据处理技术领域。该图数据处理方法包括:获取表征图数据的稀疏矩阵,稀疏矩阵包括多个行向量和多个列向量,行向量和列向量均表征图数据的顶点;对稀疏矩阵的行向量进行等值划分,得到多个稀疏分片,每个稀疏分片包括相同数量的非零元素,稀疏矩阵包括非零元素,非零元素表征图数据的不同的顶点之间的边关系;基于矩阵乘法算法将每个稀疏分片中的每个非零元素分别与预设密集矩阵进行数据融合,得到与图数据对应的结构特征,其中,多个非零元素并行与预设密集矩阵进行数据融合。
-
公开(公告)号:CN116343009A
公开(公告)日:2023-06-27
申请号:CN202310329084.2
申请日:2023-03-28
Applicant: 国网浙江省电力有限公司电力科学研究院 , 中国科学技术大学苏州高等研究院 , 国网浙江省电力有限公司宁波供电公司
IPC: G06V10/82 , G06N3/0495 , G06N3/0464 , G06N3/045
Abstract: 本发明公开了三维神经网络处理方法及图像处理方法、系统和存储介质,属于神经网络以及图像处理技术领域。本发明的一种基于分块循环矩阵的三维神经网络处理方法,通过构建分块循环矩阵模型、计算加速模型、全频域模型,克服以往剪枝等模型压缩方法存在的访存、计算不规则等问题,提出使用分块循环矩阵对三维神经网络3D CNN进行压缩,并且进一步利用快速傅立叶变换FFT加速计算,在保持模型结构规则的前提下,取得了显著的存储和计算压缩效果。在此基础上,引入频域内的激活、批归一化和池化操作,进一步消除由于快速傅立叶变换FFT带来的频繁的时域/频域切换开销,从而实现了全频域计算,进一步降低了3D CNN模型推理时的计算开销。
-
公开(公告)号:CN119598079A
公开(公告)日:2025-03-11
申请号:CN202411726882.X
申请日:2024-11-28
Applicant: 中国科学技术大学苏州高等研究院 , 中国科学技术大学
Abstract: 本发明涉及计算机技术领域,公开了一种位级可组合加速器的设计方法、设备、介质及产品。该方法包括:对待设计加速器进行位级可组合硬件建模,获取位级可组合硬件结构;根据位级可组合硬件结构,通过融合软硬件参数化描述进行位级数据流建模,获取数据流描述参数;根据数据流描述参数建立设计空间,并通过对设计空间进行最佳设计点搜索,获取目标数据流。本实施例的方案,通过进行位级可组合硬件建模、位级数据流建模和硬件调度设计搜索,可以为加速器的硬件设计和数据调度设计增加位级计算支持,可以为硬件和调度设计提供定量评估和自动化指导,可以实现自动的位级可组合加速器的硬件设计和调度优化。
-
公开(公告)号:CN118690824B
公开(公告)日:2024-12-31
申请号:CN202411186366.2
申请日:2024-08-28
Applicant: 中国科学技术大学苏州高等研究院 , 中国科学技术大学
IPC: G06N3/0895 , G06N3/0455
Abstract: 本发明提供了一种性能预测模型的训练方法及装置、性能预测方法及装置,应用于数据处理技术领域。性能预测模型的训练方法包括:利用目标计算单元对无标签神经网络结构数据执行掩码处理任务,得到可见节点特征矩阵、掩码节点特征矩阵和掩码标识矩阵;利用目标计算单元对掩码标识矩阵执行预测任务,得到述掩码标识矩阵的预测隐空间特征;利用目标计算单元对掩码节点特征矩阵执行编码任务,得到掩码节点特征矩阵的隐空间特征;利用目标计算单元对掩码标识矩阵的预测隐空间特征和掩码节点特征矩阵的隐空间特征执行损失计算任务,得到第一目标损失值;基于第一目标损失值,利用目标计算单元对性能预测模型执行训练任务,得到训练后的性能预测模型。
-
公开(公告)号:CN116663629A
公开(公告)日:2023-08-29
申请号:CN202310782272.0
申请日:2023-06-29
Applicant: 国网浙江省电力有限公司电力科学研究院 , 中国科学技术大学苏州高等研究院
IPC: G06N3/063 , G06N3/0464
Abstract: 本发明公开了一种促进神经网络加速计算的方法,涉及神经网络技术领域,用于解决现有神经网络计算分配时特征不匹配的问题,该方法包括以下步骤:获取神经网络运行参数;根据所述运行参数,计算神经网络各层仿存比;根据访存比计算结果对所述神经网络进行分组,将访存比差值在预设区间内的层分入同组;将分入同组的层分配给同一处理引擎。本发明还公开了一种神经网络计算加速装置及电子设备。本发明通过访存比对神经网络层进行分组,并匹配合适的处理引擎,使得神经网络计算分配时特征匹配,性能优。
-
公开(公告)号:CN118690824A
公开(公告)日:2024-09-24
申请号:CN202411186366.2
申请日:2024-08-28
Applicant: 中国科学技术大学苏州高等研究院 , 中国科学技术大学
IPC: G06N3/0895 , G06N3/0455
Abstract: 本发明提供了一种性能预测模型的训练方法及装置、性能预测方法及装置,应用于数据处理技术领域。性能预测模型的训练方法包括:利用目标计算单元对无标签神经网络结构数据执行掩码处理任务,得到可见节点特征矩阵、掩码节点特征矩阵和掩码标识矩阵;利用目标计算单元对掩码标识矩阵执行预测任务,得到述掩码标识矩阵的预测隐空间特征;利用目标计算单元对掩码节点特征矩阵执行编码任务,得到掩码节点特征矩阵的隐空间特征;利用目标计算单元对掩码标识矩阵的预测隐空间特征和掩码节点特征矩阵的隐空间特征执行损失计算任务,得到第一目标损失值;基于第一目标损失值,利用目标计算单元对性能预测模型执行训练任务,得到训练后的性能预测模型。
-
-
-
-
-
-
-
-
-