Transformer大模型的推理方法、装置、计算机设备和存储介质

    公开(公告)号:CN116992965B

    公开(公告)日:2024-01-09

    申请号:CN202311259769.0

    申请日:2023-09-27

    申请人: 之江实验室

    发明人: 陈志伟 张逸

    摘要: 本申请涉及Transformer大模型的推理方法、装置、计算机设备和存储介质,在使用Transformer大模型进行实际推理之前,利用权重校正系数向量将权重矩阵进行校正,将权重矩阵中各数值的差异进行压制,并将权重校正矩阵进行低比特整型量化;在使用Transformer大模型进行实际推理时,将实际输入激活矩阵与激活量化校正系数向量的乘积、量化后的综合校正系数向量及校正量化后的权重矩阵进行矩阵相乘,得到初始推理结果矩阵;基于第一量化参数标量、第二量化参数标量以及第三量化参数标量,对初始推理结果矩阵进行反量化,得到实际推理结果矩阵,有效节省在GPU中部署所占用的显存资源及有效提高计算机处理速度。(56)对比文件杨云;王全.层聚合的对抗机器翻译模型的方法研究.陕西科技大学学报.2020,(第01期),全文.苏畅;付忠良;谭雨辰.一种在GPU上高精度大型矩阵快速运算的实现.计算机应用.2009,(第04期),全文.姚志湘;孙增强;粟晖;袁洪福.通过向量角转换校正拉曼光谱中乘性干扰.光谱学与光谱分析.2016,(第02期),全文.

    蛋白质语言模型的量化方法、装置、设备和存储介质

    公开(公告)号:CN116153389B

    公开(公告)日:2023-07-18

    申请号:CN202310431440.1

    申请日:2023-04-21

    申请人: 之江实验室

    发明人: 彭爽 杨非 张逸 孙柠

    IPC分类号: G16B5/00 G16B40/00

    摘要: 本申请涉及人工智能领域,特别是涉及一种蛋白质语言模型的量化方法、装置、设备和存储介质,所述方法包括:采用均匀对称量化方法对蛋白质语言模型的权重值进行量化;通过校准数据集确定所述蛋白质语言模型的激活值的第一截断范围,并将所述第一截断范围划分为多个量化区间;通过分段线性量化方法分别对所述多个量化区间的激活值进行量化;基于量化后的权重值以及量化后的激活值,配置得到量化后的蛋白质语言模型。本发明提出的量化方法降低了模型量化的精度损失,在保证量化后模型预测精度的同时,减少模型的内存占用,提升模型推理速度。

    一种基于图像知识回顾的深度卷积神经网络自蒸馏方法

    公开(公告)号:CN114022727A

    公开(公告)日:2022-02-08

    申请号:CN202111221950.3

    申请日:2021-10-20

    申请人: 之江实验室

    摘要: 本发明公开了本发明公开一种基于图像知识回顾的深度卷积神经网络自蒸馏方法,该方法首先针对目标网络设置辅助网络,在目标网络的下采样层引出分支,采用知识回顾的思路依次融合和连接各个分支,在训练过程中,通过监督学习以及采用目标网络的下采样层向引出分支层进行学习的方式,达到自蒸馏的目的。本发明在深度卷积神经网络自蒸馏领域引入知识回顾的思路,提高了深度卷积神经网络的训练精度;采用辅助网络的形式进行自蒸馏,相对使用数据增强来拉进类内距离的自蒸馏方法,在实际应用中更加简洁方便。

    一种吊装物体单阶检测方法、装置、电子设备及存储介质

    公开(公告)号:CN112215308A

    公开(公告)日:2021-01-12

    申请号:CN202011456486.1

    申请日:2020-12-13

    申请人: 之江实验室

    摘要: 本发明公开了一种吊装物体单阶检测方法、装置、电子设备及存储介质,该方法包括:获取吊装物体图像,作为训练集;对训练集进行特征提取,获得目标坐标及旋转角度;使用基于深度卷积神经网络的检测模型作为吊装物体检测的基线网络架构,并按旋转框方式修改检测模型;使用所述训练集、目标坐标及旋转角度对修改后的检测模型进行训练,获得训练好的检测模型;使用训练好的检测模型对待检测的图像进行检测,获得图像中带旋转角度的吊装物体的检测结果。本发明实现方法简单,可移植性强,能够实现对监控摄像头拍摄的厂区、工地等作业场所中吊装物体的精准检测。

    Transformer大模型的推理方法、装置、计算机设备和存储介质

    公开(公告)号:CN116992965A

    公开(公告)日:2023-11-03

    申请号:CN202311259769.0

    申请日:2023-09-27

    申请人: 之江实验室

    发明人: 陈志伟 张逸

    摘要: 本申请涉及Transformer大模型的推理方法、装置、计算机设备和存储介质,在使用Transformer大模型进行实际推理之前,利用权重校正系数向量将权重矩阵进行校正,将权重矩阵中各数值的差异进行压制,并将权重校正矩阵进行低比特整型量化;在使用Transformer大模型进行实际推理时,将实际输入激活矩阵与激活量化校正系数向量的乘积、量化后的综合校正系数向量及校正量化后的权重矩阵进行矩阵相乘,得到初始推理结果矩阵;基于第一量化参数标量、第二量化参数标量以及第三量化参数标量,对初始推理结果矩阵进行反量化,得到实际推理结果矩阵,有效节省在GPU中部署所占用的显存资源及有效提高计算机处理速度。

    用于导览机器人的算法调度方法、装置及导览机器人系统

    公开(公告)号:CN116991246A

    公开(公告)日:2023-11-03

    申请号:CN202311256743.0

    申请日:2023-09-27

    申请人: 之江实验室

    IPC分类号: G06F3/01 G06F9/48

    摘要: 本申请涉及导览机器人领域,特别是涉及一种用于导览机器人的算法调度方法、装置及导览机器人系统。所述方法包括:按照预设周期监测各所述处理器的运行参数;基于所述各所述处理器的运行参数,确定其中是否存在待算法调度的处理器以及接收算法调度的处理器;若存在待算法调度的处理器以及接收算法调度的处理器,则基于所述待算法调度的处理器所执行的算法或待恢复的算法的优先级,将对应的算法调度至所述接收算法调度的处理器。本发明使得导览机器人做到高效实时的智能交互,达到最优的用户体验。

    蛋白质语言模型的量化方法、装置、设备和存储介质

    公开(公告)号:CN116153389A

    公开(公告)日:2023-05-23

    申请号:CN202310431440.1

    申请日:2023-04-21

    申请人: 之江实验室

    发明人: 彭爽 杨非 张逸 孙柠

    IPC分类号: G16B5/00 G16B40/00

    摘要: 本申请涉及人工智能领域,特别是涉及一种蛋白质语言模型的量化方法、装置、设备和存储介质,所述方法包括:采用均匀对称量化方法对蛋白质语言模型的权重值进行量化;通过校准数据集确定所述蛋白质语言模型的激活值的第一截断范围,并将所述第一截断范围划分为多个量化区间;通过分段线性量化方法分别对所述多个量化区间的激活值进行量化;基于量化后的权重值以及量化后的激活值,配置得到量化后的蛋白质语言模型。本发明提出的量化方法降低了模型量化的精度损失,在保证量化后模型预测精度的同时,减少模型的内存占用,提升模型推理速度。

    基于深度卷积神经网络BN层尺度系数的卷积核嫁接方法

    公开(公告)号:CN113435588A

    公开(公告)日:2021-09-24

    申请号:CN202110988504.9

    申请日:2021-08-26

    申请人: 之江实验室

    IPC分类号: G06N3/04 G06N3/08

    摘要: 本发明公开了基于深度卷积神经网络BN层尺度系数的卷积核嫁接方法,首先设置两组不同的训练策略;然后采用两组策略训练同构的两个深度卷积神经网络,训练过程中,对两个深度卷积神经网络的BN层尺度系数进行稀疏化;同时采用特征图学习的方式,保持两个深度卷积神经网络的层内卷积核权值分布的一致性;根据BN层尺度系数,每隔一定迭代次数,将其中一个深度卷积神经网络层内BN层对应尺度系数小的卷积核,替换为另一个深度卷积神经网络层内BN层对应尺度系数大的卷积核。

    一种基于知识蒸馏的行人重识别模型压缩方法及评价方法

    公开(公告)号:CN113297906A

    公开(公告)日:2021-08-24

    申请号:CN202110423900.7

    申请日:2021-04-20

    摘要: 本发明公开了一种基于知识蒸馏的行人重识别模型压缩方法及评价方法,压缩方法包括如下步骤:S1:预训练行人重识别教师模型;S2:构建行人重识别学生模型;S3:构建低阶状态蒸馏损失和高阶结构蒸馏损失,将教师模型的知识迁移到学生模型,联合优化行人重识别任务损失和蒸馏损失进行训练;评价方法还包括如下步骤:S4:将底库测试集输入训练好的学生模型,获得底库行人特征;S5:将查询测试集输入训练好的学生模型,获得行人特征,与底库行人特征进行相似度计算,经度量排序找到与之具有相同身份的底库行人图片,计算时间效率和性能准确度。

    一种基于单模型预测的安全帽佩戴检测方法及装置

    公开(公告)号:CN111723786B

    公开(公告)日:2020-12-25

    申请号:CN202010851025.8

    申请日:2020-08-21

    申请人: 之江实验室

    摘要: 本发明公开了一种基于单模型预测的安全帽佩戴检测方法及装置,该方法包括将原始图像输入到一个深度卷积神经网络中,在深度卷积神经网络的不同层中提取出原始图像的表观特征,并采用特征金字塔网络在表观特征上获取不同尺度的特征图;将不同尺度的特征图分别输入到坐标回归网络和行人识别网络中,分别输出在原始图像中检测到的行人目标的位置和识别的置信度,通过非极大值抑制方法找到最佳的目标边界框,并消除冗余的边界框;将不同尺度的特征图输入到基于注意力机制的安全帽佩戴分类网络中,最终得到行人目标是否佩戴安全帽的检测结果。通过单个模型来对监控摄像头拍摄的厂区、工地等作业场所中工作人员是否佩戴安全帽的精准识别。