一种应用于机器翻译的知识融合方法
摘要:
本发明公开一种应用于机器翻译的知识融合方法,步骤为:使用双语语料库进行训练一个或多个神经机器翻译模型作为知识的提供者,也就是教师模型;对语料库中的源语S进行翻译和教师模型知识提取;进行知识的融合;复制源语S,并进行拼接,最终获得知识融合后的语料;训练最终使用的神经机器翻译模型;对双语语料库中的源语句进行解码,首先把对应源语句使用相同句子拼接方法,并且使用分隔符号进行分隔,然后送进最终所训练的神经机器翻译模型中进行解码,之后对解码出来的结果进行分隔,分隔标识为句子拼接时所用分隔符,实现知识融合。本发明解决了知识往往带有较多错误的问题,可将教师模型的知识和真实语料中的知识相互融合形成知识丰富的语料。
0/0