- 专利标题: 生成语音模型和语音识别的方法、装置、设备以及介质
-
申请号: CN202010165847.0申请日: 2020-03-11
-
公开(公告)号: CN111354345B公开(公告)日: 2021-08-31
- 发明人: 蔡猛 , 梁镇麟
- 申请人: 北京字节跳动网络技术有限公司
- 申请人地址: 北京市石景山区实兴大街30号院3号楼2层B-0035房间
- 专利权人: 北京字节跳动网络技术有限公司
- 当前专利权人: 抖音视界有限公司
- 当前专利权人地址: 100041 北京市石景山区实兴大街30号院3号楼2层B-0035房间
- 代理机构: 北京唯智勤实知识产权代理事务所
- 代理商 陈佳
- 主分类号: G10L15/06
- IPC分类号: G10L15/06 ; G10L15/16
摘要:
本公开的实施例公开了生成语音模型和语音识别的方法、装置、设备以及介质。该方法的一具体实施方式包括:获取训练样本集,其中,训练样本集中的训练样本包括语音样本和语音样本对应的识别结果样本;根据训练样本集,对初始模型进行联合学习训练,得到语音模型,其中,初始模型包括多层输出层。本公开实施例的技术方案实现了训练过程的简化和语音模型的识别准确率的提高。
公开/授权文献
- CN111354345A 生成语音模型和语音识别的方法、装置、设备以及介质 公开/授权日:2020-06-30