-
公开(公告)号:CN116186272B
公开(公告)日:2023-07-14
申请号:CN202310440825.4
申请日:2023-04-23
Applicant: 之江实验室
IPC: G06F16/35 , G06F18/22 , G06F18/214 , G06F18/241
Abstract: 本说明书公开了一种联合训练方法、装置、存储介质及电子设备。在本说明书提供的联合训练方法中,获取样本语句以及对应的标注意图和标注实体,并将样本语句分为支持集和查询集;将每个样本语句输入待训练的语句处理模型;若该样本语句属于所述支持集,则通过提取子网提取该样本语句和标注的特征;将特征输入原型构建子网,确定出与标注对应的标注特征;若该样本语句属于所述查询集,提取该样本语句的特征;通过匹配子网确定特征与匹配子网存储的各标准特征之间的相似度;通过意图识和槽位填充子网分别根据相似度确定预测意图和预测实体;以预测意图和标注意图之间的差异最小,以及预测实体和标注实体之间的差异最小为优化目标,对模型进行训练。
-
公开(公告)号:CN116363418A
公开(公告)日:2023-06-30
申请号:CN202310240413.6
申请日:2023-03-06
IPC: G06V10/764 , G06V10/774 , G06V10/82
Abstract: 本说明书公开了一种训练分类模型的方法、装置、存储介质及电子设备。本方法通过确定各子网络层对应的输入维度中的无效维度,确定了对分类模型的输出结果无效的各子网络层对应的无效维度上各计算节点输出的结果,根据这些输出的结果确定第一损失,根据基于训练样本标注确定的第二损失以及该第一损失,确定总损失,以总损失最小训练分类模型,减少了各子网络层对应的无效维度上各计算节点输出的结果对分类模型的输出结果的影响,提高了分类模型的分类准确性。
-
公开(公告)号:CN116150380A
公开(公告)日:2023-05-23
申请号:CN202310413634.9
申请日:2023-04-18
Applicant: 之江实验室
IPC: G06F16/35 , G06F18/22 , G06N3/0455 , G06N3/0895
Abstract: 本说明书公开了一种文本匹配方法、装置、存储介质及设备,根据匹配的文本对中各原始文本的表征向量的第一相似度、该文本对中各原始文本与各自变形文本的表征向量间的第二相似度及各原始文本与其他原始文本的表征向量的第三相似度,确定该文本对的损失。该第一相似度与第二相似度皆与该文本对的损失负相关,第三相似度与该文本对的损失正相关。在根据各文本对的损失确定总损失,并以总损失最小为目标训练得到训练后的表征模型后,则可响应于匹配请求,通过训练后的表征模型确定待匹配文本对的表征向量,以根据得到的表征向量确定待匹配文本对的匹配结果。可训练得到可输出准确表征向量的表征模型,提升基于表征模型进行文本匹配的匹配准确度。
-
公开(公告)号:CN116151354B
公开(公告)日:2023-07-18
申请号:CN202310411396.8
申请日:2023-04-10
Applicant: 之江实验室
Abstract: 本申请涉及一种网络节点的学习方法、装置、电子装置和存储介质,所述方法包括:基于层次标签树中目标网络节点对应的目标标签信息,确定目标注意力向量,所述层次标签树包含多个网络节点的标签信息之间的隶属关系;基于所述目标注意力向量,对多个所述网络节点进行采样,并基于采样结果获取所述目标网络节点的相邻网络节点以及对应的相邻注意力向量;对所述目标注意力向量以及所述相邻注意力向量进行聚合,得到所述目标网络节点的目标表示向量。通过本申请,解决了相关技术中网络节点的表示学习不够准确的技术问题,提高了网络节点表示学习时表示向量的全面性,更有利于挖掘网络节点之间的相似性和关联性,进而提高了网络节点学习的准确性。
-
公开(公告)号:CN116151355B
公开(公告)日:2023-07-11
申请号:CN202310422202.4
申请日:2023-04-19
Applicant: 之江实验室
IPC: G06N3/08 , G06N3/0455 , G06N3/0442 , G06F40/295
Abstract: 本说明书公开了一种模型训练和业务执行的方法、装置、介质及设备。所述模型训练和业务执行的方法包括:将样本语句输入待训练业务模型,确定样本语句对应的初始语义特征,并对初始语义特征进行处理,基于第一膨胀系数和第二膨胀系数对所述处理后特征进行卷积处理,得到中间特征,基于第三膨胀系数和第四膨胀系数对所述中间特征进行卷积处理,得到目标特征,根据目标特征,确定头尾指针矩阵以及字间关系矩阵,根据头尾指针矩阵以及字间关系矩阵,确定目标特征矩阵,基于目标特征矩阵,识别样本语句中包含的实体对象,以最小化识别出的实体对象与样本语句中实际包含的实体对象之间的偏差为优化目标,对业务模型进行训练。
-
公开(公告)号:CN116151354A
公开(公告)日:2023-05-23
申请号:CN202310411396.8
申请日:2023-04-10
Applicant: 之江实验室
Abstract: 本申请涉及一种网络节点的学习方法、装置、电子装置和存储介质,所述方法包括:基于层次标签树中目标网络节点对应的目标标签信息,确定目标注意力向量,所述层次标签树包含多个网络节点的标签信息之间的隶属关系;基于所述目标注意力向量,对多个所述网络节点进行采样,并基于采样结果获取所述目标网络节点的相邻网络节点以及对应的相邻注意力向量;对所述目标注意力向量以及所述相邻注意力向量进行聚合,得到所述目标网络节点的目标表示向量。通过本申请,解决了相关技术中网络节点的表示学习不够准确的技术问题,提高了网络节点表示学习时表示向量的全面性,更有利于挖掘网络节点之间的相似性和关联性,进而提高了网络节点学习的准确性。
-
公开(公告)号:CN116150380B
公开(公告)日:2023-06-27
申请号:CN202310413634.9
申请日:2023-04-18
Applicant: 之江实验室
IPC: G06F16/35 , G06F18/22 , G06N3/0455 , G06N3/0895
Abstract: 本说明书公开了一种文本匹配方法、装置、存储介质及设备,根据匹配的文本对中各原始文本的表征向量的第一相似度、该文本对中各原始文本与各自变形文本的表征向量间的第二相似度及各原始文本与其他原始文本的表征向量的第三相似度,确定该文本对的损失。该第一相似度与第二相似度皆与该文本对的损失负相关,第三相似度与该文本对的损失正相关。在根据各文本对的损失确定总损失,并以总损失最小为目标训练得到训练后的表征模型后,则可响应于匹配请求,通过训练后的表征模型确定待匹配文本对的表征向量,以根据得到的表征向量确定待匹配文本对的匹配结果。可训练得到可输出准确表征向量的表征模型,提升基于表征模型进行文本匹配的匹配准确度。
-
公开(公告)号:CN115760670A
公开(公告)日:2023-03-07
申请号:CN202310023010.6
申请日:2023-01-06
IPC: G06T5/50 , G06T3/40 , G06N3/0464 , G06N3/0455 , G06N3/084 , G06N3/088
Abstract: 本发明公开了基于网络隐式先验的无监督高光谱融合方法及装置,获取低分辨率高光谱和高分辨率多光谱图像;采用噪声对图像进行扰动;将噪声扰动后的图像输入至编码器‑解码器体系结构,进行多级特征学习,生成高分辨率高光谱图像的模糊估计;对模糊估计分别进行空间和光谱下采样;基于低分辨率高光谱图像与空间下采样的结果,高分辨率多光谱图像与光谱下采样的结果,计算退化模型的损失函数,反向传播退化模型的优化参数给编码器‑解码器体系结构;重复执行上述过程,直至生成高分辨率高光谱图像的模糊估计达到循环终止条件。本发明利用两个并行的特殊卷积块分别模拟空间和光谱下采样,形成一个闭环,实现了无训练样本条件下的无监督学习。
-
公开(公告)号:CN116186272A
公开(公告)日:2023-05-30
申请号:CN202310440825.4
申请日:2023-04-23
Applicant: 之江实验室
IPC: G06F16/35 , G06F18/22 , G06F18/214 , G06F18/241
Abstract: 本说明书公开了一种联合训练方法、装置、存储介质及电子设备。在本说明书提供的联合训练方法中,获取样本语句以及对应的标注意图和标注实体,并将样本语句分为支持集和查询集;将每个样本语句输入待训练的语句处理模型;若该样本语句属于所述支持集,则通过提取子网提取该样本语句和标注的特征;将特征输入原型构建子网,确定出与标注对应的标注特征;若该样本语句属于所述查询集,提取该样本语句的特征;通过匹配子网确定特征与匹配子网存储的各标准特征之间的相似度;通过意图识和槽位填充子网分别根据相似度确定预测意图和预测实体;以预测意图和标注意图之间的差异最小,以及预测实体和标注实体之间的差异最小为优化目标,对模型进行训练。
-
公开(公告)号:CN116151355A
公开(公告)日:2023-05-23
申请号:CN202310422202.4
申请日:2023-04-19
Applicant: 之江实验室
IPC: G06N3/08 , G06N3/0455 , G06N3/0442 , G06F40/295
Abstract: 本说明书公开了一种模型训练和业务执行的方法、装置、介质及设备。所述模型训练和业务执行的方法包括:将样本语句输入待训练业务模型,确定样本语句对应的初始语义特征,并对初始语义特征进行处理,基于第一膨胀系数和第二膨胀系数对所述处理后特征进行卷积处理,得到中间特征,基于第三膨胀系数和第四膨胀系数对所述中间特征进行卷积处理,得到目标特征,根据目标特征,确定头尾指针矩阵以及字间关系矩阵,根据头尾指针矩阵以及字间关系矩阵,确定目标特征矩阵,基于目标特征矩阵,识别样本语句中包含的实体对象,以最小化识别出的实体对象与样本语句中实际包含的实体对象之间的偏差为优化目标,对业务模型进行训练。
-
-
-
-
-
-
-
-
-