-
公开(公告)号:CN116741180A
公开(公告)日:2023-09-12
申请号:CN202311013449.7
申请日:2023-08-14
申请人: 北京分音塔科技有限公司
摘要: 本发明公开了一种基于声纹增强和对抗的语音识别模型训练方法及装置,包括:获取待训练的语音样本以及样本标签;对每个语音样本,添加说话人标识符;其中,所述说话人标识符用于标识该语音样本的作用类别;其中,所述作用类别至少包括正向增强类别、负向减弱类别以及不处理类别;基于所述说话人标识符、所述语音样本以及所述样本标签,对待训练的神经网络模型进行迭代训练,得到训练完成的语音识别模型;可见,本发明能够实现一个语音识别模型来增强或弱化特定说话人的语音识别性能。
-
公开(公告)号:CN116741180B
公开(公告)日:2023-10-31
申请号:CN202311013449.7
申请日:2023-08-14
申请人: 北京分音塔科技有限公司
摘要: 本发明公开了一种基于声纹增强和对抗的语音识别模型训练方法及装置,包括:获取待训练的语音样本以及样本标签;对每个语音样本,添加说话人标识符;其中,所述说话人标识符用于标识该语音样本的作用类别;其中,所述作用类别至少包括正向增强类别、负向减弱类别以及不处理类别;基于所述说话人标识符、所述语音样本以及所述样本标签,对待训练的神经网络模型进行迭代训练,得到训练完成的语音识别模型;可见,本发明能够实现一个语音识别模型来增强或弱化特定说话人的语音识别性能。
-