- 专利标题: 预训练模型的训练方法、编码特征获取方法及相关装置
-
申请号: CN202110791198.X申请日: 2021-07-13
-
公开(公告)号: CN113257238B公开(公告)日: 2021-10-01
- 发明人: 李航 , 康昱 , 丁文彪 , 刘子韬
- 申请人: 北京世纪好未来教育科技有限公司
- 申请人地址: 北京市海淀区中关村大街32号蓝天和盛大厦1702-03室
- 专利权人: 北京世纪好未来教育科技有限公司
- 当前专利权人: 北京世纪好未来教育科技有限公司
- 当前专利权人地址: 北京市海淀区中关村大街32号蓝天和盛大厦1702-03室
- 代理机构: 上海知锦知识产权代理事务所
- 代理商 李丽
- 主分类号: G10L15/06
- IPC分类号: G10L15/06 ; G10L15/16 ; G10L25/30 ; G06F40/289 ; G06F40/126
摘要:
本公开实施例公开了一种预训练模型的训练方法、编码特征获取方法及相关装置,方法包括:获取待识别音频的各音频帧特征与文本特征;通过文本编码模块对文本特征进行编码,得到文本编码特征;随机选择音频帧特征进行掩码处理,得到掩码音频帧特征序列;通过音频编码模块,结合文本编码特征,对各掩码音频帧特征进行编码,得到掩码音频帧编码特征序列;根据各个掩码音频帧编码特征,获取各个训练音频帧特征,并获取音频损失,调整预训练模型的参数,直至音频损失满足损失音频阈值,得到训练好的文本编码模块和音频编码模块。本公开实施例公开的预训练模型的训练、编码特征获取方法及装置,能够在较小的标注量的基础上,提高模型训练的准确性。
公开/授权文献
- CN113257238A 预训练模型的训练方法、编码特征获取方法及相关装置 公开/授权日:2021-08-13