基于跨语言预训练模型的中朝翻译质量估计方法和系统

    公开(公告)号:CN114386437B

    公开(公告)日:2022-09-27

    申请号:CN202210035223.6

    申请日:2022-01-13

    申请人: 延边大学

    摘要: 本申请公开了基于跨语言预训练模型的中朝翻译质量估计方法和系统,本方法包括:将源语言句子和机器译文拼接,并使用XLM‑R模型得到拼接句子的初始特征矩阵;对初始特征矩阵进行注意力计算,并通过卷积神经网络进行句子嵌入,得到句子向量;基于句子向量,使用全连接神经网络计算得到质量估计得分。本系统包括跨语言特征提取模块、注意力计算模块和质量估计模块;跨语言特征提取模块使用XLM‑R模型对待评估句对进行特征提取,并生成初始特征矩阵;注意力计算模块对初始特征矩阵进行注意力计算,得到句子向量;质量估计模块计算得到翻译质量估计的得分。本申请的句子嵌入质量高,有利于质量估计,有效提升中朝机器翻译质量估计任务的性能。

    基于跨语言预训练模型的中朝翻译质量估计方法和系统

    公开(公告)号:CN114386437A

    公开(公告)日:2022-04-22

    申请号:CN202210035223.6

    申请日:2022-01-13

    申请人: 延边大学

    摘要: 本申请公开了基于跨语言预训练模型的中朝翻译质量估计方法和系统,本方法包括:将源语言句子和机器译文拼接,并使用XLM‑R模型得到拼接句子的初始特征矩阵;对初始特征矩阵进行注意力计算,并通过卷积神经网络进行句子嵌入,得到句子向量;基于句子向量,使用全连接神经网络计算得到质量估计得分。本系统包括跨语言特征提取模块、注意力计算模块和质量估计模块;跨语言特征提取模块使用XLM‑R模型对待评估句对进行特征提取,并生成初始特征矩阵;注意力计算模块对初始特征矩阵进行注意力计算,得到句子向量;质量估计模块计算得到翻译质量估计的得分。本申请的句子嵌入质量高,有利于质量估计,有效提升中朝机器翻译质量估计任务的性能。