生成语音模型和语音识别的方法、装置、设备以及介质

发明授权

CN111354345B 生成语音模型和语音识别的方法、装置、设备以及介质有权

请登陆查看更多内容

专利标题： 生成语音模型和语音识别的方法、装置、设备以及介质
申请号： CN202010165847.0

申请日： 2020-03-11
公开(公告)号： CN111354345B

公开(公告)日： 2021-08-31
发明人: 蔡猛 , 梁镇麟
申请人： 北京字节跳动网络技术有限公司
申请人地址： 北京市石景山区实兴大街30号院3号楼2层B-0035房间
专利权人： 北京字节跳动网络技术有限公司
当前专利权人： 抖音视界有限公司
当前专利权人地址： 100041 北京市石景山区实兴大街30号院3号楼2层B-0035房间
代理机构： 北京唯智勤实知识产权代理事务所
代理商 陈佳
主分类号： G10L15/06
IPC分类号： G10L15/06 ; G10L15/16

摘要：

本公开的实施例公开了生成语音模型和语音识别的方法、装置、设备以及介质。该方法的一具体实施方式包括：获取训练样本集，其中，训练样本集中的训练样本包括语音样本和语音样本对应的识别结果样本；根据训练样本集，对初始模型进行联合学习训练，得到语音模型，其中，初始模型包括多层输出层。本公开实施例的技术方案实现了训练过程的简化和语音模型的识别准确率的提高。

公开/授权文献

CN111354345A 生成语音模型和语音识别的方法、装置、设备以及介质公开/授权日：2020-06-30

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L15/00	语音识别（G10L17/00优先）
G10L15/06	.创建基准模板；训练语音识别系统，例如对说话者声音特征的适应（G10L15/14优先）