根据跨语种短语表的断词器

    公开(公告)号:CN105210055B

    公开(公告)日:2018-06-12

    申请号:CN201480020924.6

    申请日:2014-04-08

    IPC分类号: G06F17/27 G06F17/28

    摘要: 描述了将单词分割成词素的自动创建的断词器,例如用以改善信息检索、机器翻译或语音处理。在各实施例中,提供了一种跨语种短语表,其包括源语言(诸如土耳其语)短语和目标语言(诸如英语)的可能的翻译,并带有相关联的概率。在各个示例中,短语表中具有类似目标语言翻译的源语言短语的块被创建。在各个示例中,使用块中的目标语言翻译的推导使得能够找到针对源语言单词的词干和词缀组合,而无需来自人类判断的输入或者对于源语言语言学规则或源语言词法的在先知识。

    翻译设备、翻译系统以及翻译方法

    公开(公告)号:CN107590136A

    公开(公告)日:2018-01-16

    申请号:CN201710319929.4

    申请日:2017-05-09

    发明人: 伊藤泰

    IPC分类号: G06F17/28

    摘要: 翻译设备、翻译系统以及翻译方法。翻译设备包括翻译单元、历史创建单元、提取单元和组合单元。翻译单元将原稿内容翻译成不同语言。当翻译单元将原稿内容从第一语言翻译成第二语言时,历史创建单元创建包括第一语言的原文与第二语言的译文之间的对应性的历史信息。当翻译单元要将原稿内容从第二语言翻译成另一种语言时,如果以第二语言记载的原稿内容存在于历史信息中,则提取单元提取不存在于历史信息中的内容。组合单元将翻译结果与替换结果组合。翻译结果通过由翻译单元翻译不存在于历史信息中的内容获得。翻译从第二语言到另一种语言执行。替换结果通过替换存在于历史信息中的内容获得。替换基于历史信息从第二语言到另一种语言执行。

    一种翻译物理设备程序界面的方法及系统

    公开(公告)号:CN107273366A

    公开(公告)日:2017-10-20

    申请号:CN201710377933.6

    申请日:2017-05-25

    发明人: 符甜

    IPC分类号: G06F17/28

    CPC分类号: G06F17/2827 G06F17/2872

    摘要: 本发明公开了一种翻译物理设备程序界面的方法,包括设置目标语言显示的规格;翻译程序界面文本列表所对应的预翻译文本,同时在获取用户输入内容的过程中,结合所述预设的目标语言显示的规格,计算所述输入内容的像素宽度和/或字符长度;将翻译的文本的像素宽度和/或字符长度与所述预翻译文本的像素宽度和/或字符长度进行相应对比,若超过所述预翻译文本的像素宽度和/或字符长度,则输出相应提示。以及一种翻译物理设备程序界面的系统。使得用户不用在翻译后反复调整软件界面以适应翻译后文本的长度。广泛应用于语言转换领域。

    词语对齐分数算出装置、词语对齐装置、以及计算机程序

    公开(公告)号:CN106062736A

    公开(公告)日:2016-10-26

    申请号:CN201580012326.9

    申请日:2015-02-12

    IPC分类号: G06F17/28

    摘要: 本发明提供一种用于以高精度进行词语对齐的装置。该装置包括:接收对照翻译句对和针对该对照翻译句对的词语对齐,以规定的顺序依次选择第1语言的句子的词语fj的选择单元;和针对第1语言的句子的所有词语算出表示由对照翻译句对的第2语言之中通过词语对齐aj与词语fj建立了对应的词语ea_{j}和词语fj构成的词语对正确的可能性的分数(102),基于该分数算出词语对齐aj的分数的循环型神经网络(RNN)(100)。RNN(100)在算出词语对(fj,ea_{j})的分数时,通过循环连接(118),基于词语对齐aj之中在词语对(fj,ea_{j})的词语fj之前通过选择单元选择出的词语的对齐全体a1j‑1算出词语对(fj,ea_{j})的分数(102)。

    一种双向词语对齐方法及装置

    公开(公告)号:CN105630776A

    公开(公告)日:2016-06-01

    申请号:CN201510998012.2

    申请日:2015-12-25

    申请人: 清华大学

    IPC分类号: G06F17/28

    CPC分类号: G06F17/2827 G06F17/289

    摘要: 本发明涉及一种双向词语对齐方法及装置,其中,方法包括构建源语言到目标语言的第一词语对齐模型和目标语言到源语言的第二词语对齐模型;利用一致性评估函数,融合两个方向的词语对齐模型,构建初始目标函数;利用一致性评估函数,对两个方向的词语对齐模型进行联合训练,形成优化目标函数;利用优化目标函数及联合训练得到的模型,对平行双语句对进行词语对齐,得到双向词语对齐结果。系统包括词语对齐模型构建模块、目标函数构建模块、联合训练模块、词语对齐分析模块。通过本发明提供方法及装置,由于引入了一致性评估函数,能对两个方向的词语对齐模型进行联合训练,使两个方向的词语对齐模型相互纠错,极大的降低了词语对齐的错误率。

    翻译装置及翻译方法
    6.
    发明公开

    公开(公告)号:CN105573989A

    公开(公告)日:2016-05-11

    申请号:CN201510717551.4

    申请日:2015-10-29

    发明人: 郑育昌

    IPC分类号: G06F17/28

    摘要: 本发明提供一种翻译装置及翻译方法,该翻译装置包括:保存单元,当第一语言的第一原始文本通过第一翻译单元被翻译成第二语言的第二翻译文本时,保存单元将第一子字符串和第二子字符串彼此关联地保存,其中,第一子字符串包括在第一原始文本中,第二子字符串包括在第二翻译文本中并且与第一子字符串对应;第二翻译单元,其将第二语言的第二原始文本翻译成第一语言的第一翻译文本;以及控制单元,当询问原始文本(其引用第二子字符串,并且对第二子字符串进行询问)被输入至第二翻译单元时,控制单元控制第二翻译单元,以便基于保存在保存单元中的信息来用第一子字符串替换包括在询问原始文本中的第二子字符串。

    根据跨语种短语表的断词器

    公开(公告)号:CN105210055A

    公开(公告)日:2015-12-30

    申请号:CN201480020924.6

    申请日:2014-04-08

    IPC分类号: G06F17/27 G06F17/28

    摘要: 描述了将单词分割成词素的自动创建的断词器,例如用以改善信息检索、机器翻译或语音处理。在各实施例中,提供了一种跨语种短语表,其包括源语言(诸如土耳其语)短语和目标语言(诸如英语)的可能的翻译,并带有相关联的概率。在各个示例中,短语表中具有类似目标语言翻译的源语言短语的块被创建。在各个示例中,使用块中的目标语言翻译的推导使得能够找到针对源语言单词的词干和词缀组合,而无需来自人类判断的输入或者对于源语言语言学规则或源语言词法的在先知识。

    激励描述集合
    9.
    发明公开

    公开(公告)号:CN102567311A

    公开(公告)日:2012-07-11

    申请号:CN201110358464.6

    申请日:2011-10-31

    申请人: 微软公司

    IPC分类号: G06F17/28

    CPC分类号: G06F17/2827

    摘要: 本文描述了激励描述集合。本公开一般描述了用来通过向(例如,群众外包服务的)贡献者显示诸如视频剪辑之类的激励来收集文本和/或语音描述的技术。用每个贡献者选择的语言的描述具有相同激励,并且由此彼此相关联。虽然每个贡献者可以是单语的,但是该技术允许对近似双语数据的收集,因为不同贡献者中可表示一种以上的语言。描述可被用作用于训练机器翻译引擎的翻译数据,以及用于训练机器释义系统的释义数据(按相同语言进行编组)。还描述了经由差异性度量来评估机器释义系统的质量。

    在线计算机辅助翻译
    10.
    发明公开

    公开(公告)号:CN102388383A

    公开(公告)日:2012-03-21

    申请号:CN200780050481.5

    申请日:2007-12-10

    IPC分类号: G06F17/28

    CPC分类号: G06F17/2827

    摘要: 本发明涉及一种在线计算机辅助翻译方法、程序产品和系统。接收源语言的源文本。将源文本分割成多个片段。从用户接收目标语言的、与所述片段中的第一片段相关联的第一译文输入。将第一译文输入存储在文本数据仓库中。