-
公开(公告)号:CN116320425A
公开(公告)日:2023-06-23
申请号:CN202310183879.7
申请日:2023-02-23
Applicant: 之江实验室
IPC: H04N19/134 , H04N19/42
Abstract: 本申请提供一种图像数据的压缩方法、装置和可读存储介质。其中,该图像数据的压缩方法,包括获取输入的原始图像的原始矩阵;通过原始图像通道指定压缩的隐空间维度,对初始隐空间特征矩阵进行初始化,得到低维隐特征矩阵;初始化原始图像数据的相关偏置属性;使用所述低维隐特征矩阵及所述相关偏置属性,得到图像数据的重建矩阵;利用所述重建矩阵和所述原始矩阵,更新低维隐特征矩阵及相关偏置属性;及,将更新完成的隐特征矩阵及更新完成的相关偏置属性进行存储,得到所述图像数据的压缩数据。
-
公开(公告)号:CN115828831B
公开(公告)日:2023-06-09
申请号:CN202310110451.X
申请日:2023-02-14
Applicant: 之江实验室
IPC: G06F30/392 , G06N3/08 , G06F115/12
Abstract: 本发明公开了一种基于深度强化学习的多芯粒芯片算子放置策略生成方法,包括:获取算子计算图和多芯粒芯片尺寸信息;根据多芯粒芯片尺寸信息生成可选的若干种目标放置芯粒网格尺寸;建立多芯粒芯片算子放置深度学习强化模型,其中多芯粒芯片算子放置深度学习强化模型包括算子运行环境模块和深度Q网络模块,算子运行模块用于根据当前环境网络和输入的动作,计算奖励值,并将环境变换到下一个状态,将奖励值和下一个状态传回深度Q网络模块,深度Q网络模块用于根据当前状态从可选的动作空间中选择价值最高的动作;基于算子运行环境模块对深度Q网络模块进行训练;利用训练好的深度强化学习模型对算子计算图在多芯粒芯片上的运行给出算子放置策略。
-
公开(公告)号:CN115460128A
公开(公告)日:2022-12-09
申请号:CN202211399069.7
申请日:2022-11-09
Applicant: 之江实验室
IPC: H04L45/02 , H04L45/586 , H04L45/76
Abstract: 本发明公开了一种面向多芯粒组合芯片的片上网络仿真系统,包括:片上网络生成单元,用于根据多芯粒组合芯片特征生成片上网络的抽象模型;数据路由仿真单元,用于对数据包在片上网络的运行进行仿真并输出数据在片上网络的仿真时间、路由所需的总周期数以及每个数据包的平均延迟。本申请通过在每个芯粒加上片间路由器并与芯粒内部的片内路由器相连,形成异构双层拓扑网络,使之可以仿真不同芯粒间的处理单元交互。对多芯粒芯片设计提供了性能评估,有利于芯片设计初期的探索;可灵活配置多芯粒芯片的各项参数,对不同规模的多芯粒芯片进行仿真。
-
公开(公告)号:CN115186821A
公开(公告)日:2022-10-14
申请号:CN202211108864.6
申请日:2022-09-13
Applicant: 之江实验室
Abstract: 本发明公开了面向芯粒的神经网络推理开销估计方法及装置、电子设备,其中面向芯粒的神经网络推理开销估计方法包括神经网络参数和芯粒拓扑结构获取、并行组内开销估计、并行组间网络传输开销估计及神经网络推理开销估计四个步骤。使得推理开销估计适用于神经网络在芯粒上并行调度的实际场景,神经网络推理开销估计能够适用于芯粒这样的拓扑结构,充分考虑芯粒上小芯片单元内外的带宽、小芯片单元内路由转发延迟和小芯片单元外路由转发延迟,使得神经网络在芯粒上的推理开销估计达到较高的精度,从而为神经网络在芯粒上加速推理所需的高性能调度策略奠定良好基础。
-
公开(公告)号:CN114638365B
公开(公告)日:2022-09-06
申请号:CN202210533446.5
申请日:2022-05-17
Applicant: 之江实验室
IPC: G06N5/04 , G06N3/08 , G06N3/04 , G06F40/279
Abstract: 本发明公开了一种机器阅读理解推理方法及装置、电子设备、存储介质,包括:S1:获取输入文本的张量A;S2:将A输入多头注意力层,得到张量B,A与B根据量化参数差距进行选择性求和,得到张量C,对C中的所有向量求第一均值和第一方差并进行归一化,得到张量D,将D输入至第一全连接神经网络,得到张量E,E经过激活函数层得到张量F,F与D根据量化参数差距进行选择性求和,得到张量G,对G中的所有向量求第二均值和第二方差并进行归一化,得到张量H;S3:重复若干次S2,得到张量K;S3:将K输入至第二全连接神经网络,得到输入文本中的每个文字作为答案的开始文字与结束文字的概率,从而得到问题答案。
-
公开(公告)号:CN114638365A
公开(公告)日:2022-06-17
申请号:CN202210533446.5
申请日:2022-05-17
Applicant: 之江实验室
IPC: G06N5/04 , G06N3/08 , G06N3/04 , G06F40/279
Abstract: 本发明公开了一种机器阅读理解推理方法及装置、电子设备、存储介质,包括:S1:获取输入文本的张量A;S2:将A输入多头注意力层,得到张量B,A与B根据量化参数差距进行选择性求和,得到张量C,对C中的所有向量求第一均值和第一方差并进行归一化,得到张量D,将D输入至第一全连接神经网络,得到张量E,E经过激活函数层得到张量F,F与D根据量化参数差距进行选择性求和,得到张量G,对G中的所有向量求第二均值和第二方差并进行归一化,得到张量H;S3:重复若干次S2,得到张量K;S3:将K输入至第二全连接神经网络,得到输入文本中的每个文字作为答案的开始文字与结束文字的概率,从而得到问题答案。
-
公开(公告)号:CN112597113B
公开(公告)日:2021-06-01
申请号:CN202110246172.7
申请日:2021-03-05
Abstract: 本发明公开了一种数据快速读取方法、装置、电子设备及存储介质,该方法包括:将数据集划分成若干份图片子集,对每个图片子集进行归一化处理,并分别聚合为一个文件;给数据集中的每个图片分配一个请求编号;通过继承深度学习平台的数据集抽象类,根据所述请求编号分别哈希计算出每个图片所在的文件地址和文件内所述的偏移信息,从而获得每张图片到该图片所属文件的映射;根据所述映射,快速读取数据集中的所有图片。将每个所述图片子集聚合为一个文件,减少了海量小样本元数据管理的开销,优化了数据集的组织形式,极大地提升了图片的读取速度;图片读取时通过多级地址映射,取代了原本低效的海量图片中随机查找的过程,极大地提升了读取速率。
-
公开(公告)号:CN112597113A
公开(公告)日:2021-04-02
申请号:CN202110246172.7
申请日:2021-03-05
Abstract: 本发明公开了一种数据快速读取方法、装置、电子设备及存储介质,该方法包括:将数据集划分成若干份图片子集,对每个图片子集进行归一化处理,并分别聚合为一个文件;给数据集中的每个图片分配一个请求编号;通过继承深度学习平台的数据集抽象类,根据所述请求编号分别哈希计算出每个图片所在的文件地址和文件内所述的偏移信息,从而获得每张图片到该图片所属文件的映射;根据所述映射,快速读取数据集中的所有图片。将每个所述图片子集聚合为一个文件,减少了海量小样本元数据管理的开销,优化了数据集的组织形式,极大地提升了图片的读取速度;图片读取时通过多级地址映射,取代了原本低效的海量图片中随机查找的过程,极大地提升了读取速率。
-
公开(公告)号:CN112149816A
公开(公告)日:2020-12-29
申请号:CN202011340107.2
申请日:2020-11-25
Applicant: 之江实验室
Abstract: 本发明公开了一种支持深度神经网络推理加速的异构存算融合系统及方法,包括:主机处理器,用于控制和管理整个异构存算融合系统;非易失内存模块,与所述主机处理器相连,用于神经网络处理;3D堆叠内存模块,与所述主机处理器相连,用于神经网络处理;网络模块,与所述主机处理器相连,用于与外部主机连接;配置电路,与所述主机处理器相连,用于接收所述主机处理器的配置命令并控制电压发生器,也用于接收所述主机处理器的配置命令并配置3D堆叠内存模块;电压发生器,分别与所述非易失内存模块和配置电路相连,用于接收所述配置电路的控制命令,对所述非易失内存模块施加外部激励,调节其电导状态。
-
公开(公告)号:CN112015673A
公开(公告)日:2020-12-01
申请号:CN202011137494.X
申请日:2020-10-22
IPC: G06F12/02
Abstract: 本发明涉及计算机内存计算领域,具体涉及一种基于混合存储的存内计算方法与装置,该方法包括:首先通过混合存储区将数据进行混合存储,然后利用数据转存区通过字线驱动器和控制器对某一指定行的数据进行移位操作,最后基于混合存储和移位操作进行数据的乘法计算。本发明结合非易失存储与内存计算,一方面计算数据以纳秒级的速度从非易失器件中获得,特别是对于深度神经网络推理这种场景,可将模型参数事先存放于非易失存储区,计算时能减少了数据访问的时间,提高了系统性能;另一方面通过改进电路操作流程,减少了不必要的数据搬移时间,使得移位时间也能缩短至纳秒级别,提升了对于乘法计算这种有大量移位操作的计算效率,提高了系统性能。
-
-
-
-
-
-
-
-
-