一种基于元学习的对抗采样训练方法及装置
摘要:
本发明公开了一种基于元学习的对抗采样训练方法及装置,所述方法:根据策略网络从K个语种构成的大任务集T中输出K维概率向量其中,为第i个语种任务集对应的采样概率,根据所述采样概率选取前M个概率最大的语种,根据所述M个概率最大语种中每个语种采样一个任务构成训练任务集,将所述训练任务集划分为支持集和查询集;所述支持集对语音识别模型初始化参数θ进行梯度下降得到更新参数所述查询集根据查询所述更新参数的效果获得查询损失向量所述查询损失向量用于对所述初始化参数θ寻优,获得最优的模型参数。以多语种元学习语音识别框架为基础,引入策略网络形成对抗训练,解决解决低资源语种识别不均衡的问题,提升训练的效果。
公开/授权文献
0/0