-
公开(公告)号:CN117390512A
公开(公告)日:2024-01-12
申请号:CN202311385324.7
申请日:2023-10-24
申请人: 联想(北京)有限公司
IPC分类号: G06F18/241 , G06F18/214
摘要: 本申请公开了一种数据处理方法及装置,所述方法包括:获得第一数据;利用处理引擎中的门控模块辨识所述第一数据的数据类型;在所述第一数据为第一类型的情况下,使用所述处理引擎中的第一处理模块对所述第一数据进行处理,以得到第二数据;在所述第一数据为第二类型的情况下,使用所述处理引擎中的第二处理模块对所述第一数据进行处理,以得到第三数据;基于经过第一样本训练的所述第一处理模块构建得到初始的第二处理模块;在所述初始的第二处理模块被构建后,所述处理引擎经过第二样本的训练,以得到所述第二处理模块;所述第一样本包括所述第一类型的样本,所述第二样本包括所述第一类型的样本和所述第二类型的样本。
-
公开(公告)号:CN114419701A
公开(公告)日:2022-04-29
申请号:CN202111667180.5
申请日:2021-12-31
申请人: 联想(北京)有限公司
摘要: 本申请实施例公开了一种对象识别方法、装置、设备及计算机存储介质,其中,所述方法包括:对原始图像进行特征解耦,得到所述原始图像中待识别对象的至少一个属性特征;在所述至少一个属性特征中,确定无法满足识别条件的目标属性特征;对所述目标属性特征进行补偿,得到至少一个补偿后的目标属性特征;基于所述原始图像和至少一个所述补偿后的目标属性特征生成至少一个待识别图像,以完成所述待识别图像中待识别对象的识别。
-
-
公开(公告)号:CN116863147A
公开(公告)日:2023-10-10
申请号:CN202310692122.0
申请日:2023-06-12
申请人: 联想(北京)有限公司
摘要: 本申请提供了一种图像识别模型的获得方法、图像识别方法、装置、电子设备及计算机可读存储介质;方法包括:获得图像对抗样本,所述图像对抗样本携带样本标签;通过图像识别模型,对所述图像对抗样本进行特征提取处理,得到相应的样本图像特征;基于所述样本图像特征,确定对应于所述样本标签的第一映射特征及对应于干扰标签的第二映射特征,所述干扰标签与所述样本标签不同;基于所述第一映射特征及所述第二映射特征,对所述图像对抗样本进行图像识别,得到相应的第一识别结果;基于所述样本标签及所述第一识别结果,对所述图像识别模型的模型参数进行更新。
-
公开(公告)号:CN116597493A
公开(公告)日:2023-08-15
申请号:CN202310633331.8
申请日:2023-05-31
申请人: 联想(北京)有限公司
IPC分类号: G06V40/16 , G06V10/82 , G06N3/0464 , G06N3/096 , G06V10/74
摘要: 本申请实施例公开了一种对象识别方法及装置,其中,所述对象识别方法包括:获取待识别图像;将所述待识别图像输入至识别模型,得到所述待识别图像中待识别对象的识别结果;其中,所述识别模型能够基于训练图像集中不同样本类别之间的语义相似程度将第一样本类别的样本特征迁移至第二样本类别,所述第一样本类别的样本数量大于所述第二样本类别的样本数量。
-
公开(公告)号:CN113077783B
公开(公告)日:2023-07-21
申请号:CN202110325580.1
申请日:2021-03-26
申请人: 联想(北京)有限公司
摘要: 本申请实施例公开了一种小语种语音语料扩增方法、装置及电子设备和存储介质,将小语种语料库中的语音的频谱特征转换为多个层级的参数,其中至少部分层级的参数中,不同层级的参数一一对应不同的声纹属性,通过对至少一个层级的参数进行调整,得到调整后的多个层级的参数,然后利用调整后的多个层级的参数生成新的频谱特征;基于新的频谱特征生成新语音作为扩增的小语种语音语料。由于对至少部分层级的参数中的任意一个层级的参数进行调整时,仅该任意一个层级的参数对应的声纹属性改变,其它层级的参数对应的声纹属性保持不变,可以实现对小语种语料库中的语音语料进行多样化扩增。
-
公开(公告)号:CN114882894A
公开(公告)日:2022-08-09
申请号:CN202210476287.X
申请日:2022-04-29
申请人: 联想(北京)有限公司
IPC分类号: G10L21/007 , G10L21/013 , G10L25/18 , G10L25/30 , G10L25/48
摘要: 本申请公开了一种语音转换方法、装置以及设备,该方法包括:获取待转换语音;将待转换语音输入到转换模型;通过转换模型对待转换语音的语义信息和非语义信息进行解耦处理,以及分别对语义信息和非语义信息进行转换处理,以生成目标风格语音;其中,目标风格语音与待转换语音的语义信息相同、非语义信息不同。
-
公开(公告)号:CN113012706B
公开(公告)日:2023-06-27
申请号:CN202110189853.4
申请日:2021-02-18
申请人: 联想(北京)有限公司
IPC分类号: G10L21/013 , G10L21/007 , G10L15/26 , G10L21/10 , G10L21/14 , G10L25/30 , G06F16/583 , G06F16/683 , G06F40/30 , G06N3/08
摘要: 本申请公开了一种数据处理方法、装置及电子设备,包括获取第一音频数据,将第一音频数据进行转换,获得第一音频图像;基于第一音频图像,生成第二音频图像;对第二音频图像对应的音频特征信息进行处理,获得第二音频数据。通过音频图像的转换方式,实现了通过已有音频数据生成与之具有相同的语义,且不同音频属性特征的音频数据的目的,降低了数据收集的时间成本及难度。
-
公开(公告)号:CN115965704A
公开(公告)日:2023-04-14
申请号:CN202211731286.1
申请日:2022-12-30
申请人: 联想(北京)有限公司
IPC分类号: G06T11/00 , G06T7/00 , G06N3/0455 , G06N3/08
摘要: 本申请公开了一种缺陷图像生成方法、装置及存储介质。该方法包括:识别第一图像中的目标主体,确定第一目标主体;确定第一目标主体上拟生成第一类型缺陷的目标区域;通过第一缺陷生成模型,基于缺陷超曲面在目标区域中生成第一类型缺陷,得到具有不同第一类型缺陷的至少一张第二图像;其中,缺陷超曲面是根据第一缺陷生成模型的模型参数确定的用于表征第一类型缺陷图像特征的向量,不同的缺陷超曲面对应不同的第一类型缺陷;第二图像用于训练缺陷检测模型,缺陷检测模型用于对目标主体进行缺陷检测。如此,就可根据训练需要,在主体的指定区域生成指定类型的缺陷,得到与真实样本分布更接近的大量缺陷图像。
-
公开(公告)号:CN113077783A
公开(公告)日:2021-07-06
申请号:CN202110325580.1
申请日:2021-03-26
申请人: 联想(北京)有限公司
摘要: 本申请实施例公开了一种小语种语音语料扩增方法、装置及电子设备和存储介质,将小语种语料库中的语音的频谱特征转换为多个层级的参数,其中至少部分层级的参数中,不同层级的参数一一对应不同的声纹属性,通过对至少一个层级的参数进行调整,得到调整后的多个层级的参数,然后利用调整后的多个层级的参数生成新的频谱特征;基于新的频谱特征生成新语音作为扩增的小语种语音语料。由于对至少部分层级的参数中的任意一个层级的参数进行调整时,仅该任意一个层级的参数对应的声纹属性改变,其它层级的参数对应的声纹属性保持不变,可以实现对小语种语料库中的语音语料进行多样化扩增。
-
-
-
-
-
-
-
-
-