一种基于Transformer模型的机器翻译模型优化方法
摘要:
本发明公开了一种基于Transformer模型的机器翻译模型优化方法,通过设计变长编码和候选块让Transformer个体具有不同的结构和参数,为词向量的学习提供多种候选模型;而后设计了交叉变异策略让Transformer个体能够进行信息交流,让处理词向量的优秀结构或参数可以遗传给下一代;之后设计了环境选择策略产生下一代Transformer个体,淘汰学习词向量效果相对较差的模型,保留学习词向量效果较为优秀的模型;之后不断迭代演化搜索找到学习词向量效果最优的Transformer模型,用于最终解决机器翻译任务,使得Transformer模型能够更好的学习机器翻译任务中的词向量表达,提高机器翻译任务的精度。
0/0