一种模型训练和业务执行的方法、装置、介质及设备

    公开(公告)号:CN116151355B

    公开(公告)日:2023-07-11

    申请号:CN202310422202.4

    申请日:2023-04-19

    Abstract: 本说明书公开了一种模型训练和业务执行的方法、装置、介质及设备。所述模型训练和业务执行的方法包括:将样本语句输入待训练业务模型,确定样本语句对应的初始语义特征,并对初始语义特征进行处理,基于第一膨胀系数和第二膨胀系数对所述处理后特征进行卷积处理,得到中间特征,基于第三膨胀系数和第四膨胀系数对所述中间特征进行卷积处理,得到目标特征,根据目标特征,确定头尾指针矩阵以及字间关系矩阵,根据头尾指针矩阵以及字间关系矩阵,确定目标特征矩阵,基于目标特征矩阵,识别样本语句中包含的实体对象,以最小化识别出的实体对象与样本语句中实际包含的实体对象之间的偏差为优化目标,对业务模型进行训练。

    一种面向天枢人工智能平台的模型结构提取方法及装置

    公开(公告)号:CN116821425A

    公开(公告)日:2023-09-29

    申请号:CN202310750193.1

    申请日:2023-06-25

    Abstract: 本发明公开了一种面向天枢人工智能平台的模型结构提取方法及装置。本发明首先“跟踪/记录”模型上的所有操作,并进一步提取模型计算图节点信息和连接关系,生成模型计算图树形结构。然后基于深度学习模型计算图信息,确定模型结构图中需要保留的层级名称,过滤基本层节点的子节点以及容器节点,同时删除相关的连接边。最后,基于美观性、易交互性和可读性为目标求解图布局方式。本发明不需要借助其他数据信息,完全基于深度神经网络计算图数据信息过滤结构图数据,解决了结构图难以获取的问题。同时,由于仅仅过滤了计算图中不重要节点,因而完整地保留了深度学习模型的主要结构信息。

    一种模型训练方法、装置、存储介质及电子设备

    公开(公告)号:CN116304704A

    公开(公告)日:2023-06-23

    申请号:CN202310275618.8

    申请日:2023-03-14

    Abstract: 本说明书公开了一种模型训练方法、装置、存储介质及电子设备,本说明书实施例针对确定的算子集合中的每个基础算子,确定与该基础算子具有第一阶数关系的目标算子,若算子集合不包含目标算子,或者目标算子无法通过算子集合中的基础算子拼接实现,则将目标算子保存于算子集合中,将目标算子重新确定为基础算子,继续确定出与重新确定为基础算子具有第一阶数关系的目标算子,直到确定出目标算子已保存在算子集合中为止。这样构建算子集合的方法,可以避免算子集合中出现重复的算子,从而避免将算子集合中的算子部署到深度学习框架中会出现算子冗余问题。

    一种模型训练和业务执行的方法、装置、介质及设备

    公开(公告)号:CN116151355A

    公开(公告)日:2023-05-23

    申请号:CN202310422202.4

    申请日:2023-04-19

    Abstract: 本说明书公开了一种模型训练和业务执行的方法、装置、介质及设备。所述模型训练和业务执行的方法包括:将样本语句输入待训练业务模型,确定样本语句对应的初始语义特征,并对初始语义特征进行处理,基于第一膨胀系数和第二膨胀系数对所述处理后特征进行卷积处理,得到中间特征,基于第三膨胀系数和第四膨胀系数对所述中间特征进行卷积处理,得到目标特征,根据目标特征,确定头尾指针矩阵以及字间关系矩阵,根据头尾指针矩阵以及字间关系矩阵,确定目标特征矩阵,基于目标特征矩阵,识别样本语句中包含的实体对象,以最小化识别出的实体对象与样本语句中实际包含的实体对象之间的偏差为优化目标,对业务模型进行训练。

Patent Agency Ranking