-
公开(公告)号:CN110853654B
公开(公告)日:2021-12-21
申请号:CN201911123580.2
申请日:2019-11-17
Applicant: 西北工业大学
Abstract: 本申请提供一种模型生成方法、声纹识别方法及对应装置,在训练阶段利用学习类中心的训练样本对构造方法,通过给训练集中每个说话人一个预设类中心向量,与神经网络的输出向量组成样本对,根据最大化ROC曲线下的部分面积构造的损失函数来计算的损失,根据得到的损失来训练神经网络模型的参数和预设类中心向量,获得提取声纹特征的神经网络模型,提供了一种新的确认损失函数,并为该确认损失函数提供了一种新的训练样本对构造方法,由于该确认损失函数是在最大化ROC曲线下指定的面积,因此针对不同应用场景下的声纹识别系统训练特定的模型,学习类中心的训练样本对构造方法,解决了传统随机采样训练样本对构造方法中存在的训练不稳定问题。
-
公开(公告)号:CN108520752B
公开(公告)日:2021-03-12
申请号:CN201810382018.0
申请日:2018-04-25
Applicant: 西北工业大学
Abstract: 本发明提供了一种声纹识别方法和装置,涉及声纹识别的技术领域,该方法包括:获取第一向量和第二向量,其中,第一向量为待测试语音波形的紧凑表示向量,第二向量为已知语音波形的紧凑表示向量,已知语音波形为所属于目标对象的语音数据,待测试语音波形为被测试的是否属于目标对象的语音数据;获取变换矩阵;基于变换矩阵分别对第一向量和第二向量进行补偿,得到第一目标向量和第二目标向量;通过计算第一目标向量和第二目标向量的余弦相似度来确定待测试语音波形是否属于目标对象。本发明解决了现有技术中在复杂场景下的声纹识别精度无法满足应用需求的技术问题。
-
公开(公告)号:CN110853654A
公开(公告)日:2020-02-28
申请号:CN201911123580.2
申请日:2019-11-17
Applicant: 西北工业大学
Abstract: 本申请提供一种模型生成方法、声纹识别方法及对应装置,在训练阶段利用学习类中心的训练样本对构造方法,通过给训练集中每个说话人一个预设类中心向量,与神经网络的输出向量组成样本对,根据最大化ROC曲线下的部分面积构造的损失函数来计算的损失,根据得到的损失来训练神经网络模型的参数和预设类中心向量,获得提取声纹特征的神经网络模型,提供了一种新的确认损失函数,并为该确认损失函数提供了一种新的训练样本对构造方法,由于该确认损失函数是在最大化ROC曲线下指定的面积,因此针对不同应用场景下的声纹识别系统训练特定的模型,学习类中心的训练样本对构造方法,解决了传统随机采样训练样本对构造方法中存在的训练不稳定问题。
-
公开(公告)号:CN110838295A
公开(公告)日:2020-02-25
申请号:CN201911123586.X
申请日:2019-11-17
Applicant: 西北工业大学
IPC: G10L17/02 , G10L17/04 , G10L17/18 , G10L21/0208
Abstract: 本申请提供一种模型生成方法、声纹识别方法及对应装置,该方法包括:将多个训练样本输入预设的神经网络模型,以计算每一训练样本经过所述预设神经网络模型的输出向量,其中,多个训练样本中部分训练样本为相同说话人的声学特征,部分训练样本为不同说话人的声学特征;根据相同说话人的输出向量计算相同说话人的类内协方差;根据任意两个不同说话人的输出向量计算任意两个不同说话人的输出向量之间的欧式距离;根据不同说话人的输出向量之间的欧式距离、相同说话人的类内协方差以及预先构建的损失函数计算对应的训练损失;根据训练损失对神经网络模型的各个参数进行迭代更新,以得到声纹特征提取模型。
-
公开(公告)号:CN110838295B
公开(公告)日:2021-11-23
申请号:CN201911123586.X
申请日:2019-11-17
Applicant: 西北工业大学
IPC: G10L17/02 , G10L17/04 , G10L17/18 , G10L21/0208
Abstract: 本申请提供一种模型生成方法、声纹识别方法及对应装置,该方法包括:将多个训练样本输入预设的神经网络模型,以计算每一训练样本经过所述预设神经网络模型的输出向量,其中,多个训练样本中部分训练样本为相同说话人的声学特征,部分训练样本为不同说话人的声学特征;根据相同说话人的输出向量计算相同说话人的类内协方差;根据任意两个不同说话人的输出向量计算任意两个不同说话人的输出向量之间的欧式距离;根据不同说话人的输出向量之间的欧式距离、相同说话人的类内协方差以及预先构建的损失函数计算对应的训练损失;根据训练损失对神经网络模型的各个参数进行迭代更新,以得到声纹特征提取模型。
-
公开(公告)号:CN108520752A
公开(公告)日:2018-09-11
申请号:CN201810382018.0
申请日:2018-04-25
Applicant: 西北工业大学
Abstract: 本发明提供了一种声纹识别方法和装置,涉及声纹识别的技术领域,该方法包括:获取第一向量和第二向量,其中,第一向量为待测试语音波形的紧凑表示向量,第二向量为已知语音波形的紧凑表示向量,已知语音波形为所属于目标对象的语音数据,待测试语音波形为被测试的是否属于目标对象的语音数据;获取变换矩阵;基于变换矩阵分别对第一向量和第二向量进行补偿,得到第一目标向量和第二目标向量;通过计算第一目标向量和第二目标向量的余弦相似度来确定待测试语音波形是否属于目标对象。本发明解决了现有技术中在复杂场景下的声纹识别精度无法满足应用需求的技术问题。
-
-
-
-
-