一种应用于机器翻译的知识融合方法

发明公开

请登陆查看更多内容

专利标题： 一种应用于机器翻译的知识融合方法
申请号： CN202111269722.3

申请日： 2021-10-29
公开(公告)号： CN114118106A

公开(公告)日： 2022-03-01
发明人: 杨迪 , 毕东
申请人： 沈阳雅译网络技术有限公司
申请人地址： 辽宁省沈阳市和平区三好街78号东软电脑城C座11层
专利权人： 沈阳雅译网络技术有限公司
当前专利权人： 沈阳雅译网络技术有限公司
当前专利权人地址： 辽宁省沈阳市和平区三好街78号东软电脑城C座11层
代理机构： 沈阳新科知识产权代理事务所
代理商 李晓光
主分类号： G06F40/58
IPC分类号： G06F40/58 ; G06N3/04 ; G06N3/08

摘要：

本发明公开一种应用于机器翻译的知识融合方法，步骤为：使用双语语料库进行训练一个或多个神经机器翻译模型作为知识的提供者，也就是教师模型；对语料库中的源语S进行翻译和教师模型知识提取；进行知识的融合；复制源语S，并进行拼接，最终获得知识融合后的语料；训练最终使用的神经机器翻译模型；对双语语料库中的源语句进行解码，首先把对应源语句使用相同句子拼接方法，并且使用分隔符号进行分隔，然后送进最终所训练的神经机器翻译模型中进行解码，之后对解码出来的结果进行分隔，分隔标识为句子拼接时所用分隔符，实现知识融合。本发明解决了知识往往带有较多错误的问题，可将教师模型的知识和真实语料中的知识相互融合形成知识丰富的语料。

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06F	电数字数据处理（基于特定计算模型的计算机系统入G06N）
G06F40/00	处理自然语言数据（语音分析或综合，语音识别G10L）
G06F40/40	.自然语言的处理或翻译(自然语言分析入G06F40/20；语义分析入G06F40/30)
G06F40/58	..使用机器翻译，例如用于多语言检索，用于客户端设备的服务器端翻译或实时翻译。