发明公开
- 专利标题: 多语言翻译模型的生成方法、翻译方法、终端及介质
-
申请号: CN202211011066.1申请日: 2022-08-23
-
公开(公告)号: CN115796192A公开(公告)日: 2023-03-14
- 发明人: 陶恒韬 , 王晖 , 颜达森 , 王进 , 张艳 , 易泽轩
- 申请人: 鹏城实验室
- 申请人地址: 广东省深圳市南山区兴科一街2号
- 专利权人: 鹏城实验室
- 当前专利权人: 鹏城实验室
- 当前专利权人地址: 广东省深圳市南山区兴科一街2号
- 代理机构: 深圳市君胜知识产权代理事务所
- 代理商 刘芙蓉; 温宏梅
- 主分类号: G06F40/58
- IPC分类号: G06F40/58 ; G06F18/214
摘要:
本发明实施例提供了一种多语言翻译模型的生成方法、翻译方法、终端及存储介质,通过获取多个第一单语语句,对预设自回归语言模型进行训练,生成预训练语言模型;所述预设自回归语言模型由解码器组成;获取多个双语语句对,并将所述双语语句对中互译的两个语句拼接,生成双语训练样本;基于所述双语训练样本对所述预训练语言模型进行训练,生成多语言翻译模型;所述多语言翻译模型用于将给定的源语言翻译出目标语句。通过上述方案,利用稀缺语言资源生成高翻译质量的多语言翻译模型,实现高质量的多语言翻译。