翻译方法、装置、可读介质及电子设备

    公开(公告)号:CN115409044B

    公开(公告)日:2024-11-05

    申请号:CN202211034229.8

    申请日:2022-08-26

    IPC分类号: G06F40/47 G06N3/04 G06N3/096

    摘要: 本公开涉及一种翻译方法、装置、可读介质及电子设备,所述方法包括:获取待翻译的源文本和目标语言;将源文本和目标语言输入预先基于非自回归模型生成的目标翻译模型,得到目标翻译模型输出的目标文本,目标文本是源文本按照目标语言翻译后的文本;目标翻译模型用于确定源文本按照目标语言翻译后的多个待定字符,针对每个待定字符,将待定字符作为当前字符,确定当前字符对应的关联度,关联度用于表征当前字符与剩余字符为相邻字符的概率,所述剩余字符包括多个所述待定字符中在所述当前字符之后的待定字符,根据多个所述关联度,从多个所述待定字符中确定多个目标待定字符,并将多个所述目标待定字符组成的文本作为所述目标文本。

    基于知识蒸馏的机器翻译模型训练方法、装置、设备及介质

    公开(公告)号:CN111950302B

    公开(公告)日:2023-11-10

    申请号:CN202010843014.5

    申请日:2020-08-20

    发明人: 袁秋龙

    摘要: 本发明提供一种基于知识蒸馏的机器翻译模型训练方法、装置、设备和介质,该方法包括:获取教师模型和学生模型;获取样本数据集,包含训练语料;将训练语料输入教师模型,得到教师模型中被简化模块输出的中间内容、教师模型输出的最终结果;将训练语料输入学生模型,得到学生模型中被简化模块输出的中间内容、学生模型输出的最终结果;根据训练语料的标注翻译标签、教师模型中被简化模块输出的中间内容、教师模型输出的最终结果、学生模型中被简化模块输出的中间内容、学生模型输出的最终结果,确定模型损失函数;根据模型损失函数对学生模型进行迭代训练。本发明利用教师模型对学生模型进行训练,在模型结构简化的情况下,保证模型的性能效果。

    术语语料库的分享方法、终端及服务器

    公开(公告)号:CN116911319A

    公开(公告)日:2023-10-20

    申请号:CN202310805419.3

    申请日:2023-07-03

    发明人: 符甜

    IPC分类号: G06F40/47

    摘要: 本发明属于计算机辅助翻译技术领域,具体涉及术语语料库的分享方法、终端及服务器,包括:所述术语语料资源的输出端连接有构件术语语料资源库,所述构件术语语料资源库的输出端连接读取一条语料资源,所述读取一条语料资源的输出端连接有的提取相应的语料特征。语料库会建立新的语料特征库,对所需检索的语料进行分析更新,并将检索的语料特征存储至新的语料特征库中,从而可以构件新的语料特征库,从而可以从新对检索的语料特征进行匹配,有效的解决了检索时术语语料特征不对应,无法获得所需要的信息。

    计算机辅助翻译方法、装置、计算机设备及存储介质

    公开(公告)号:CN109918685B

    公开(公告)日:2023-10-17

    申请号:CN201910203934.8

    申请日:2019-03-18

    发明人: 王晓辉 周子轩

    IPC分类号: G06F40/47

    摘要: 本发明实施例公开了一种计算机辅助翻译方法、装置、计算机设备及存储介质,所述方法包括:响应于在当前界面的原文区域中触发的辅助翻译指令,识别该辅助翻译指令所指向的待翻译文章的目标原文句;获取当前界面的译文区域中与所述目标原文句对应的目标译文句;移动所述目标译文句在所述译文区域中的位置,使所述目标译文句和目标原文句位置对齐。本发明实施例通过建立原文和译文的视觉关联性,以降低译员的视觉干扰,提高译员的翻译效率。

    生成对抗样本的方法、装置、设备、存储介质及程序产品

    公开(公告)号:CN116681091A

    公开(公告)日:2023-09-01

    申请号:CN202210161770.9

    申请日:2022-02-22

    摘要: 本申请实施例提供了一种生成对抗样本的方法、装置、设备、存储介质及程序产品,涉及人工智能领域,应用场景包括但不限于机器翻译等场景。该方法包括:获取待翻译的源文本和源文本对应的目标文本;确定源文本对应的待识别对抗样本,以及目标文本对应的待识别对抗样本;基于源文本和源文本对应的待识别对抗样本,确定第一相似度下降率;并基于源文本、目标文本和目标文本对应的待识别对抗样本,确定第二相似度下降率;若第一相似度下降率大于预设第一相似度下降率阈值,且第二相似度下降率小于预设第二相似度下降率阈值,则确定源文本对应的待识别对抗样本为源文本的对抗样本,以及目标文本对应的待识别对抗样本为目标文本的对抗样本。

    实现数据国际化的方法、装置、系统及服务器

    公开(公告)号:CN116432667A

    公开(公告)日:2023-07-14

    申请号:CN202211610967.2

    申请日:2022-12-14

    IPC分类号: G06F40/58 G06F40/47

    摘要: 本申请公开了一种实现数据国际化的方法、装置、系统及服务器。该方法包括:通过数据采集模块获取多数据源,多数据源包括动态数据和静态数据,通过翻译管理模块分别对动态数据和静态数据进行翻译,以得到动态翻译数据和静态翻译数据;将动态翻译数据同步到国际化应用程序接口服务模块进行存储,并将静态翻译数据存储在翻译管理模块;在接收到业务查询装置的翻译查询指令的情况下,根据翻译查询指令从翻译管理模块导出静态翻译数据或者通过国际化应用程序接口服务模块查询动态翻译数据。本申请通过对多数据源的动态数据和静态数据的集中翻译和管理,可以减少冗余的翻译资源和翻译资源浪费,提高翻译速度,加速国际化部署。

    一种用于翻译机记录的关键词查找系统及方法

    公开(公告)号:CN116414943A

    公开(公告)日:2023-07-11

    申请号:CN202310031499.1

    申请日:2023-01-09

    发明人: 邓彪

    摘要: 本发明公开了一种用于翻译机记录的关键词查找系统及方法,属于翻译机技术领域。一种用于翻译机记录的关键词查找系统及方法,包括翻译机主体,翻译机主体上安装有输入机构、摄像机构和输出机构,输入机构包括文字输入模块、语音识别模块和语音录音模块,翻译机主体的内部设置有翻译模块,翻译模块与语音识别模块和语音录音模块连接,翻译机主体的内部还设置有与翻译模块连接的翻译记录存储模块,翻译记录存储模块上连接有关键词捕捉筛选记录模块,关键词捕捉筛选记录模块上连接有关键词提示模块。该用于翻译机记录的关键词查找系统及方法,方便了使用者的使用,更方便了使用者理解对方阐述语言的真正含义,减少了一语双关不被理解的尴尬。

    基于LSTM神经网络的词向量生成方法及装置

    公开(公告)号:CN110866404B

    公开(公告)日:2023-05-05

    申请号:CN201911045096.2

    申请日:2019-10-30

    发明人: 张睦

    摘要: 本发明实施例提供一种基于LSTM神经网络的词向量生成方法及装置,其中方法包括根据多个译员的语料的初始词向量训练双向LSTM神经网络;从多个译员中确定目标译员,根据目标译员的语料对应的编辑行为数据训练词向量模型;将多个译员的语料输入至训练后的词向量模型,根据单向LSTM神经网络的输出获得中间词向量;根据目标译员的语料的中间词向量调整双向LSTM神经网络;将多个译员的语料的中间词向量输入至调整后的双向LSTM神经网络,根据双向LSTM神经网络产生的用于预测的向量获得最终的词向量。本发明实施例生成的词向量可以广泛应用于各种自然语言的处理任务。