-
公开(公告)号:CN116798411A
公开(公告)日:2023-09-22
申请号:CN202210255889.2
申请日:2022-03-15
申请人: 清华大学 , 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC分类号: G10L15/06 , G10L15/02 , G10L19/038 , G10L25/30
摘要: 本发明公开了一种多语言训练方法、装置及存储介质,包括:通过神经网络获取音韵特征后,转化为以矢量编码的音素嵌入矢量,其中,将音韵特征编码为音韵矢量;获取声谱后,通过声学模型DNN提取声学特征;将音素嵌入矢量与声学特征进行内积后计算出音素的后验概率。采用本发明,避免了现有技术中训练音韵特征提取器的麻烦。使得跨语言zero‑shot的学习成为了可能,对于从未见过的音素,也能有较好的迁移效果。