发明公开
- 专利标题: 一种基于固定范式的术语翻译方法及系统
-
申请号: CN202111338870.6申请日: 2021-11-12
-
公开(公告)号: CN114330375A公开(公告)日: 2022-04-12
- 发明人: 贝超 , 宗浩 , 苑聪虎 , 刘清民
- 申请人: 中译语通科技股份有限公司
- 申请人地址: 北京市石景山区石景山路20号中铁建设大厦16层
- 专利权人: 中译语通科技股份有限公司
- 当前专利权人: 中译语通科技股份有限公司
- 当前专利权人地址: 北京市石景山区石景山路20号中铁建设大厦16层
- 代理机构: 北京兴智翔达知识产权代理有限公司
- 代理商 李琴
- 主分类号: G06F40/58
- IPC分类号: G06F40/58 ; G06F40/47 ; G06N3/08 ; G06F40/295
摘要:
本发明是属于机器翻译技术领域,具体提供了一种基于固定范式的术语翻译方法及系统,其中方法包括:根据用户或者翻译需求,以key‑value储存形式存储在数据库中,当有新的术语原文翻译需求时,继续导入即可;根据训练集中的术语库,匹配训练语料中的句对,将原文术语替换为“__start__目标术语译文__end__”;将处理过的术语库加入训练集中,混淆后正常训练得到机器翻译模型;从数据库中读取术语库后,使用正向最大匹配算法匹配术语原文,并将术语匹配后的原文使用神经网络机器翻译模型进行翻译得到目标译文。利用固定范式,在不更改神经网络模型的情况下,通过模型训练,强化模型的学习这一范式的能力,仅仅在翻译前进行处理,使得某些术语的译文可以人为指定。