专利检索 ap:("北京分音塔科技有限公司") AND inv:"杜文强" 第 1 页

1.

发明公开
基于声纹增强和对抗的语音识别模型训练方法及装置审中-公开

公开(公告)号：CN116741180A

公开(公告)日：2023-09-12

申请号：CN202311013449.7

申请日：2023-08-14

申请人： 北京分音塔科技有限公司

发明人： 张明 , 杜文强

IPC分类号： G10L17/02 , G10L15/06 , G10L15/16 , G10L17/04 , G10L17/18

摘要： 本发明公开了一种基于声纹增强和对抗的语音识别模型训练方法及装置，包括：获取待训练的语音样本以及样本标签；对每个语音样本，添加说话人标识符；其中，所述说话人标识符用于标识该语音样本的作用类别；其中，所述作用类别至少包括正向增强类别、负向减弱类别以及不处理类别；基于所述说话人标识符、所述语音样本以及所述样本标签，对待训练的神经网络模型进行迭代训练，得到训练完成的语音识别模型；可见，本发明能够实现一个语音识别模型来增强或弱化特定说话人的语音识别性能。

2.

发明授权
基于声纹增强和对抗的语音识别模型训练方法及装置有权

公开(公告)号：CN116741180B

公开(公告)日：2023-10-31

申请号：CN202311013449.7

申请日：2023-08-14

申请人： 北京分音塔科技有限公司

发明人： 张明 , 杜文强

IPC分类号： G10L17/02 , G10L15/06 , G10L15/16 , G10L17/04 , G10L17/18

摘要： 本发明公开了一种基于声纹增强和对抗的语音识别模型训练方法及装置，包括：获取待训练的语音样本以及样本标签；对每个语音样本，添加说话人标识符；其中，所述说话人标识符用于标识该语音样本的作用类别；其中，所述作用类别至少包括正向增强类别、负向减弱类别以及不处理类别；基于所述说话人标识符、所述语音样本以及所述样本标签，对待训练的神经网络模型进行迭代训练，得到训练完成的语音识别模型；可见，本发明能够实现一个语音识别模型来增强或弱化特定说话人的语音识别性能。