预训练模型的训练方法、编码特征获取方法及相关装置

发明授权

CN113257238B 预训练模型的训练方法、编码特征获取方法及相关装置有权

请登陆查看更多内容

专利标题： 预训练模型的训练方法、编码特征获取方法及相关装置
申请号： CN202110791198.X

申请日： 2021-07-13
公开(公告)号： CN113257238B

公开(公告)日： 2021-10-01
发明人: 李航 , 康昱 , 丁文彪 , 刘子韬
申请人： 北京世纪好未来教育科技有限公司
申请人地址： 北京市海淀区中关村大街32号蓝天和盛大厦1702-03室
专利权人： 北京世纪好未来教育科技有限公司
当前专利权人： 北京世纪好未来教育科技有限公司
当前专利权人地址： 北京市海淀区中关村大街32号蓝天和盛大厦1702-03室
代理机构： 上海知锦知识产权代理事务所
代理商 李丽
主分类号： G10L15/06
IPC分类号： G10L15/06 ; G10L15/16 ; G10L25/30 ; G06F40/289 ; G06F40/126

摘要：

本公开实施例公开了一种预训练模型的训练方法、编码特征获取方法及相关装置，方法包括：获取待识别音频的各音频帧特征与文本特征；通过文本编码模块对文本特征进行编码，得到文本编码特征；随机选择音频帧特征进行掩码处理，得到掩码音频帧特征序列；通过音频编码模块，结合文本编码特征，对各掩码音频帧特征进行编码，得到掩码音频帧编码特征序列；根据各个掩码音频帧编码特征，获取各个训练音频帧特征，并获取音频损失，调整预训练模型的参数，直至音频损失满足损失音频阈值，得到训练好的文本编码模块和音频编码模块。本公开实施例公开的预训练模型的训练、编码特征获取方法及装置，能够在较小的标注量的基础上，提高模型训练的准确性。

公开/授权文献

CN113257238A 预训练模型的训练方法、编码特征获取方法及相关装置公开/授权日：2021-08-13

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L15/00	语音识别（G10L17/00优先）
G10L15/06	.创建基准模板；训练语音识别系统，例如对说话者声音特征的适应（G10L15/14优先）