发明授权
- 专利标题: 语音识别模型的生成方法、语音识别方法、装置
-
申请号: CN202010573393.0申请日: 2020-06-22
-
公开(公告)号: CN111696526B公开(公告)日: 2021-09-10
- 发明人: 赵媛媛 , 王晓瑞 , 李岩
- 申请人: 北京达佳互联信息技术有限公司
- 申请人地址: 北京市海淀区上地西路6号1幢1层101D1-7
- 专利权人: 北京达佳互联信息技术有限公司
- 当前专利权人: 北京达佳互联信息技术有限公司,北京快手科技有限公司
- 当前专利权人地址: 北京市海淀区上地西路6号1幢1层101D1-7
- 代理机构: 广州华进联合专利商标代理有限公司
- 代理商 谢曲曲
- 主分类号: G10L15/02
- IPC分类号: G10L15/02 ; G10L15/06
摘要:
本公开关于一种语音识别模型的生成方法、语音识别方法、装置、电子设备及存储介质,其中,语音识别模型的生成方法包括:对多个语音信号样本各自对应的原始语音特征序列进行划分,生成每个语音信号样本对应的多个原始语音特征块;采用待训练的语音识别模型对每个语音信号样本对应的多个原始语音特征块分别进行识别,得到每个语音信号样本的预测文本序列;根据每个语音信号样本对应的预测文本序列,对待训练的语音识别模型进行训练,直至达到预设停止条件,生成语音识别模型。由于该方法训练过程中的语音识别模型进行语音识别是基于划分好的特征块进行,从而不再依赖整句输入,使得训练得到的语音识别模型能够有效应用于流式的场景中。
公开/授权文献
- CN111696526A 语音识别模型的生成方法、语音识别方法、装置 公开/授权日:2020-09-22