-
公开(公告)号:CN110648671A
公开(公告)日:2020-01-03
申请号:CN201910775992.8
申请日:2019-08-21
申请人: 广州国音智能科技有限公司
摘要: 本发明公开了一种声纹模型重建方法,包括以下步骤:获取语音样本数据,基于所述语音样本数据生成初始声纹模型,其中,所述语音样本数据包括多个子语音样本数据,而后基于所述初始声纹模型获取各个子语音样本数据的声纹特征向量,并基于K-Means算法以及各个声纹特征向量对所述语音样本数据进行聚类,将所述语音样本数据分成预设数量的子样本集,接下来基于所述预设数量的子样本集生成目标声纹模型。本发明还公开了一种装置、终端及可读存储介质。本发明通过对语音样本数据进行聚类分组,进而以迭代的方式利用分组后的语音子样本集训练声纹模型,提升了声纹模型训练效率,以及声纹模型的健壮性。
-
公开(公告)号:CN110364169A
公开(公告)日:2019-10-22
申请号:CN201910777107.X
申请日:2019-08-21
申请人: 广州国音智能科技有限公司
摘要: 本发明公开了一种声纹识别方法、装置、设备及计算机可读存储介质,该方法包括步骤:获取用于声纹识别的语音信息,并对语音信息进行分解,得到第一模态信号和除第一模态之外的模态信号;对第一模态信号进行降噪处理,再将降噪后的第一模态信号与除第一模态之外的模态信号进行相加重构,得到待识别声纹信息;计算待识别声纹信息的识别度;根据识别度判断待识别声纹信息是否为目标声纹。本发明提供了声纹识别的方法,提高了现有技术对声纹识别不准确的问题。
-