发明公开
- 专利标题: 一种应用于机器翻译的知识融合方法
-
申请号: CN202111269722.3申请日: 2021-10-29
-
公开(公告)号: CN114118106A公开(公告)日: 2022-03-01
- 发明人: 杨迪 , 毕东
- 申请人: 沈阳雅译网络技术有限公司
- 申请人地址: 辽宁省沈阳市和平区三好街78号东软电脑城C座11层
- 专利权人: 沈阳雅译网络技术有限公司
- 当前专利权人: 沈阳雅译网络技术有限公司
- 当前专利权人地址: 辽宁省沈阳市和平区三好街78号东软电脑城C座11层
- 代理机构: 沈阳新科知识产权代理事务所
- 代理商 李晓光
- 主分类号: G06F40/58
- IPC分类号: G06F40/58 ; G06N3/04 ; G06N3/08
摘要:
本发明公开一种应用于机器翻译的知识融合方法,步骤为:使用双语语料库进行训练一个或多个神经机器翻译模型作为知识的提供者,也就是教师模型;对语料库中的源语S进行翻译和教师模型知识提取;进行知识的融合;复制源语S,并进行拼接,最终获得知识融合后的语料;训练最终使用的神经机器翻译模型;对双语语料库中的源语句进行解码,首先把对应源语句使用相同句子拼接方法,并且使用分隔符号进行分隔,然后送进最终所训练的神经机器翻译模型中进行解码,之后对解码出来的结果进行分隔,分隔标识为句子拼接时所用分隔符,实现知识融合。本发明解决了知识往往带有较多错误的问题,可将教师模型的知识和真实语料中的知识相互融合形成知识丰富的语料。