面向多核向量处理器的稀疏bert模型加速方法、装置、设备及介质

    公开(公告)号:CN119476359A

    公开(公告)日:2025-02-18

    申请号:CN202411048856.6

    申请日:2024-08-01

    Abstract: 本申请公开了面向多核向量处理器的稀疏bert模型加速方法、装置、设备及介质,涉及向量处理器技术领域,构建预训练语言模进行调整优化;确定图优化操作的类型;类型为算子微调,利用优化后的预训练语言模型和多核向量处理器,结合层归一化和矩阵转置,实现对目标应用场景的图优化操作;类型为算子融合,基于多核向量处理器对优化后的预训练语言模型中的各层编码器进行算子融合,实现对目标应用场景的图优化操作;类型为存储优化,基于多核向量处理器对优化后的预训练语言模型进行数据存储结构优化和数据重用设计,实现对目标应用场景的图优化操作,能充分发挥多核向量处理器并行计算能力,提高数据复用性及数据存储效果。

    面向人头检测的目标检测器
    12.
    发明公开

    公开(公告)号:CN118230361A

    公开(公告)日:2024-06-21

    申请号:CN202410437479.9

    申请日:2024-04-12

    Abstract: 本发明涉及面向人头检测的目标检测器,包括:输入层,用于输入待检测图像;骨干网络的输入端,与输入层的输出端连接,用于接收待检测图像,并据此生成多尺度特征;编码器的输入端,与骨干网络的输出端连接,用于接收多尺度特征,并据此生成多尺度特征图;辅助检测头的输入端和解码器检测头的输入端,均与编码器的输出端连接;以训练时将编码器输出的多尺度特征图输入辅助检测头和解码器检测头进行联合训练;辅助检测头的输出端,还与解码器检测头的输入端连接,以训练时将辅助检测头生成的正样本查询和真实框生成的对比去噪样本查询输入解码器检测头进行辅助训练;输出层,与解码器检测头连接,用于输出人头检测结果。

    目标检测网络的训练方法、电子设备及存储介质

    公开(公告)号:CN111353580B

    公开(公告)日:2023-06-20

    申请号:CN202010078783.0

    申请日:2020-02-03

    Abstract: 本申请公开一种目标检测网络的训练方法、电子设备及存储介质,该方法包括:分别构建孪生网络和目标检测网络的网络结构;获取训练集,训练集中包括多组含有飞行器图像的交叉样本图像;根据训练集包括的交叉样本图像训练孪生网络,得到训练后的孪生网络对应的网络参数;根据网络参数和训练集包括的交叉样本图像,训练目标检测网络。本申请根据训练好的孪生网络的网络参数和训练集来训练目标检测网络。由于孪生网络的网络参数对于不同样本具有很好的鲁棒性,因此将训练好的孪生网络的网络参数作为目标检测网络的初始化参数,能够使得目标检测网络在初始状态具备较好的鲁棒性,从而训练后能够提高目标检测的准确性。

    一种图像动态模糊消除方法、装置、设备及存储介质

    公开(公告)号:CN115861130A

    公开(公告)日:2023-03-28

    申请号:CN202211727440.8

    申请日:2022-12-30

    Abstract: 本申请公开了一种图像动态模糊消除方法、装置、设备及存储介质,涉及图像处理技术领域,包括:基于预先选定的单输出头结构的深度去模糊网络构建多输出头结构的初始深度去模糊网络;对多输出头结构的初始深度去模糊网络中的各初始输出头进行训练,得到训练后的多输出头结构的目标深度去模糊网络;其中,各训练后输出头为具有不同恢复特征的输出头;将模糊图像输入至目标深度去模糊网络,得到各训练后输出头输出的不同清晰特征的恢复图像。本申请通过将模糊图像输入至训练后的多输出头结构的目标深度去模糊网络,得到多张不同清晰特征的恢复图像,能够提高恢复图像的质量,避免恢复图像质量上出现训练质量退化、恢复图像模糊的问题。

    一种数据管理方法、系统、设备和存储介质

    公开(公告)号:CN115529194A

    公开(公告)日:2022-12-27

    申请号:CN202211496502.9

    申请日:2022-11-28

    Abstract: 本申请公开了一种数据管理方法、系统、设备和存储介质,特别是涉及一种数据管理方法,包括:根据第一用户的数据分享请求,判断所述第一用户是否具备数据分享权限,若是,则:根据所述数据分享请求,生成数据分享信息;将所述数据分享信息发送至第二用户;根据所述数据分享信息,获取密文数据;获取第一秘钥,并利用所述第一秘钥对所述密文数据进行解密,得到第一解密数据;判断所述第二用户是否具备数据获取权限,若是,则:获取第二秘钥,并利用所述第二秘钥对所述第一解密数据进行解密,得到第二解密数据;将所述第二解密数据发送至所述第二用户;本申请方案,能在保证云存储数据安全的前提下,实现数据的安全分享。

    一种面向向量处理器的半精度向量化卷积方法及系统

    公开(公告)号:CN114281755A

    公开(公告)日:2022-04-05

    申请号:CN202111662053.6

    申请日:2021-12-30

    Abstract: 本发明公开了一种面向向量处理器的半精度向量化卷积方法及系统,方法包括:将半精度权值数据和半精度输入数据存储在双倍速率同步动态随机存储器中;调用直接存储器访问操作,将半精度输入数据和半精度权值数据从所述双倍速率同步动态随机存储器分别加载到片上标量存储器SM空间和片上阵列存储器AM空间;在SM空间中,对加载到片上SM空间的输入数据进行向量化处理,在AM空间中,将向量化处理后的输入数据与AM空间上的权值数据做卷积操作conv3×3,得到卷积后的特征图数据。本发明能够结合向量处理器的体系结构特征,将卷积计算(conv3×3)面向向量处理器体系结构向量化,在保证精度的前提下实现了FLOPs的提升。

    一种面向向量处理器的池化向量化实现方法

    公开(公告)号:CN113806261A

    公开(公告)日:2021-12-17

    申请号:CN202111178180.9

    申请日:2021-10-09

    Abstract: 本发明公开了一种面向向量处理器的池化向量化实现方法,包括如下步骤:根据AM空间参数、池化窗口预设参数,获取输入分块特征图每次传入AM空间的传输分块参数;基于DMA操作将分块特征图子块加载至所述AM空间;根据预设规则将单个所述分块特征图子块进行分区;根据预设顺序依次对分块特征图子块的每个区域进行池化处理;基于DMA操作将处理后获得的输出特征图子块从所述AM空间中导出至存储器中;重复上述步骤直至获取所有分块特征图子块的池化结果。该方法逻辑清晰,安全、有效、可靠且操作简便,既能支持非方形特征图、非方形移动步长、非方形池化窗口,又能支持特征图填充,无需对特征图重排,提高池化处理效率。

    指定标签的对抗样本生成方法、装置、电子设备及介质

    公开(公告)号:CN111340180B

    公开(公告)日:2021-10-08

    申请号:CN202010084790.1

    申请日:2020-02-10

    Abstract: 本申请提供一种指定标签的对抗样本生成方法及装置、一种电子设备以及一种计算机可读介质。方法包括:将原始图像样本输入预设多标签分类网络,得到用于对原始图像样本进行多标签分类的各个标签的预测分数值;从各个标签的预测分数值中抽取指定标签对应的预测分数值;根据指定标签对应的预测分数值,采用动量快速梯度迭代MI‑FGSM方法生成第一攻击扰动;利用梯度权值类别响应图Grad‑CAM方法对第一攻击扰动进行裁剪,得到第二攻击扰动;将第二攻击扰动叠加到所述原始图像样本上,生成与所述指定标签对应的对抗样本。通过本方案,可以有选择性地生成指定标签的对抗样本,可以用于多标签分类网络数据增广,从而提升多标签分类模型的分类能力。

Patent Agency Ranking