-
公开(公告)号:CN112632914A
公开(公告)日:2021-04-09
申请号:CN202011541438.2
申请日:2020-12-23
申请人: 平安科技(深圳)有限公司
IPC分类号: G06F40/151
摘要: 本申请公开一种文本处理方法及装置,其中,文本处理方法可以包括:获取非标准文本,并确定所述非标准文本对应的非标准类别;根据所述非标准类别,确定正则化模型的模型参数的更新值;采用所述更新值对所述正则化模型的模型参数的值进行更新,并利用更新后的正则化模型对所述非标准文本进行处理,获得至少一个向量;根据所述至少一个向量,确定所述非标准文本对应的标准文本。采用本申请,可以提高所获得的标准文本的准确性。
-
公开(公告)号:CN112562700A
公开(公告)日:2021-03-26
申请号:CN202011432589.4
申请日:2020-12-10
申请人: 平安科技(深圳)有限公司
摘要: 本发明涉及人工智能技术领域,公开了情感语音的合成方法、装置、设备及存储介质,用于解决合成语音平淡、缺乏情感的问题,增加合成语音的多样性。情感语音的合成方法包括:获取待识别语音数据和对应的文本数据;将所述待识别语音数据输入预先训练好的情感识别网络中,生成梅尔谱特征和位置编码,并结合所述梅尔谱特征和所述位置编码在所述情感识别网络中进行处理,生成情感嵌入特征;将所述情感嵌入特征和所述文本数据输入预先训练好的语音合成网络中,生成目标梅尔谱数据;采用神经声码器对所述目标梅尔谱数据进行语音转换,生成目标情感语音。此外,本发明还涉及区块链技术,待识别语音数据和文本数据可存储于区块链中。
-
公开(公告)号:CN112562634A
公开(公告)日:2021-03-26
申请号:CN202011385987.5
申请日:2020-12-02
申请人: 平安科技(深圳)有限公司
摘要: 本发明涉及人工智能领域,公开了一种多风格音频合成方法、装置、设备及存储介质。该方法包括:获取待处理的文本数据和单风格的第一梅尔谱;将所述第一梅尔谱输入预置风格提取网络进行特征提取,得到第一风格特征;将所述文本数据输入预置梅尔谱生成网络中的编码器进行特征提取以及将提取到的第一文本特征与所述第一风格特征进行拼接,得到第一融合特征;将所述第一融合特征输入预置梅尔谱生成网络中的解码器进行特征转换,得到第二梅尔谱;将所述第二梅尔谱输入预置声码器进行音频生成,得到多风格音频。本发明利用风格特征作为声码器的条件特征,能够生成多风格的音频。
-
公开(公告)号:CN112528013A
公开(公告)日:2021-03-19
申请号:CN202011435074.X
申请日:2020-12-10
申请人: 平安科技(深圳)有限公司
IPC分类号: G06F16/34 , G06F40/205
摘要: 本发明涉及自然语言处理技术,揭露一种文本摘要提取方法,包括:在Bert模型中添加奇偶句编码层得到编码器,从transformer模型中提取解码器,组合所述编码器和所述解码器得到待训练文本摘要提取模型,对训练文本集执行分句操作得到训练语段集,接收用户在所述训练语段集中添加的特征提取标识符,利用所述训练语段集及所述特征提取标识符训练所述待训练文本摘要提取模型,得到文本摘要提取模型,接收摘要待提取文本,将所述摘要待提取文本输入至所述文本摘要提取模型得到文本摘要。本发明还揭露文本摘要提取装置、电子设备以及存储介质。本发明可解决文本摘要提取过程中,缺少对文本奇偶句划分及重要语段识别的能力,进而影响文本摘要提取准确率的问题。
-
公开(公告)号:CN112509600A
公开(公告)日:2021-03-16
申请号:CN202011446585.1
申请日:2020-12-11
申请人: 平安科技(深圳)有限公司
IPC分类号: G10L25/24 , G10L21/013 , G10L25/30
摘要: 本申请涉及语音处理领域,并公开了一种语音转换模型的训练方法、装置、语音转换方法、设备及存储介质,所述方法包括:获取样本音频,将所述样本音频转换为样本梅尔频谱,所述样本音频包括无标签音频和有标签音频;采集噪声音频,并将所述噪声音频和所述样本梅尔频谱共同输入生成网络,得到输出梅尔频谱,所述噪声音频为无标签音频;将所述输出梅尔频谱输入判别网络,得到所述输出梅尔频谱的类型概率和所述输出梅尔频谱的标签;根据所述输出梅尔频谱的类型概率和所述输出梅尔频谱的标签对所述生成网络和所述判别网络进行交替迭代训练,并将训练完成的生成网络作为语音转换模型。以降低构建模型对于音频语料的要求,降低模型构建的复杂度。
-
公开(公告)号:CN112446207A
公开(公告)日:2021-03-05
申请号:CN202011385255.6
申请日:2020-12-01
申请人: 平安科技(深圳)有限公司
IPC分类号: G06F40/258 , G06F40/126 , G06F40/30
摘要: 标题生成方法、装置、电子设备及存储介质。本发明涉及一种智能决策领域,揭露了一种标题生成方法,包括:获取原始语料集,对所述原始语料集进行预处理操作及分割符标识,生成目标语料集;利用预构建的标题生成模型对所述目标语料集进行向量编码、语义编码及标题序列解码,得到解码标题,计算所述解码标题与所述原始语料集对应标签的损失值,根据所述损失值调整所述标题生成模型的参数,直至所述损失值小于预设的阈值时,得到训练完成的标题生成模型;基于用户输入的标题风格,利用所述训练完成的标题生成模型对待生成标题的语料进行标题生成,得到生成结果。此外,本发明还涉及区块链技术,所述目标语料集可存储于区块链中。本发明可以生成流畅符合语义及满足用户风格的标题。
-
公开(公告)号:CN112397047A
公开(公告)日:2021-02-23
申请号:CN202011442571.2
申请日:2020-12-11
申请人: 平安科技(深圳)有限公司
摘要: 本发明涉及语音合成技术,揭露一种语音合成方法,包括:获取样本音频,对所述样本音频进行声音特征提取转换及向量化处理,得到标准语音向量;当接收待合成文本时,对所述待合成文本进行音素转换得到文本音素序列;对所述文本音素序列进行向量转换,得到文本矩阵;将所述标准语音向量与所述文本矩阵进行向量拼接,得到目标矩阵;对所述目标矩阵进行频谱特征提取,得到频谱特征信息;利用预设声码器对所述频谱特征信息进行语音合成,得到合成音频。本发明还涉及一种区块链技术,所述频谱特征信息可以存储在区块链中。本发明还提出一种语音合成装置、电子设备以及可读存储介质。本发明可以提高语音合成的灵活性。
-
公开(公告)号:CN112382309A
公开(公告)日:2021-02-19
申请号:CN202011446542.3
申请日:2020-12-11
申请人: 平安科技(深圳)有限公司
摘要: 本申请涉及分类模型领域,并公开了一种情绪识别模型的训练方法、装置、设备及存储介质,所述方法包括:获取样本音频,所述样本音频中包括正面情绪音频和负面情绪音频,并分别对所述正面情绪音频和所述负面情绪音频进行特征提取,得到语音特征;根据所述语音特征对所述样本音频中的所述正面情绪音频进行音频过滤,得到过滤后的样本音频;对所述样本音频中的负面情绪音频进行数据增强,得到新增负面情绪音频;将所述过滤后的样本音频以及所述新增负面情绪音频输入至预设的神经网络进行模型训练,以得到情绪识别模型。以使情绪识别模型能够准确对用户的情绪进行识别。此外,本发明还涉及区块链技术,所述样本音频可存储于区块链中。
-
公开(公告)号:CN112257555A
公开(公告)日:2021-01-22
申请号:CN202011123302.X
申请日:2020-10-20
申请人: 平安科技(深圳)有限公司
摘要: 本申请实施例公开了一种信息处理方法、装置、设备及存储介质。其中,一种信息处理识别方法包括:获取关于目标道路的至少两帧图像;所述至少两帧图像中包括第一图像和第二图像;对第一图像进行交通标志检测,得到目标交通标志在第一图像中的第一图像区域,对第二图像进行交通标志检测,得到目标交通标志在第二图像中的第二图像区域;根据第二图像区域对第一图像区域进行补偿处理,得到补偿处理后的第一图像区域;根据补偿处理后的第一图像区域确定目标道路的道路结构信息,目标道路的道路结构信息用于描述目标交通标志位于目标道路中的位置。采用本申请,可以提高获取目标道路的道路结构信息的准确率。
-
公开(公告)号:CN112101481A
公开(公告)日:2020-12-18
申请号:CN202011097292.7
申请日:2020-10-14
申请人: 平安科技(深圳)有限公司
摘要: 本发明涉及数据分析技术,揭露了一种目标物的影响因子筛选方法,包括:将标准图像输入至分类模型中得到标准图像为目标类别的类别预测值;对所述类别预测值进行计算得到待选取的影响因子的数量;利用分类模型对多个影响因子进行计算得到各个影响因子的影响预测值,根据影响预测值从预设的多个影响因子中选取所述数量的影响因子作为目标因子集合;计算目标因子集合中每个影响因子的标签值,从目标因子集合中选取标签值为预设标签阈值的影响因子作为标准影响因子。本发明还提出了目标物的影响因子筛选装置及计算机可读存储介质。此外,本发明还涉及区块链技术,标准图像可存储于区块链节点中。本发明可获取深度学习模型的输入数据中的影响因素。
-
-
-
-
-
-
-
-
-