- 专利标题: 基于神经机器翻译系统的单词预测方法及系统
-
申请号: CN201611209226.8申请日: 2016-12-23
-
公开(公告)号: CN106844352B公开(公告)日: 2019-11-08
- 发明人: 张家俊 , 赵阳 , 王亦宁 , 宗成庆
- 申请人: 中国科学院自动化研究所
- 申请人地址: 北京市海淀区中关村东路95号
- 专利权人: 中国科学院自动化研究所
- 当前专利权人: 中国科学院自动化研究所
- 当前专利权人地址: 北京市海淀区中关村东路95号
- 代理机构: 北京瀚仁知识产权代理事务所
- 代理商 郭文浩; 李飞
- 主分类号: G06F17/28
- IPC分类号: G06F17/28 ; G06F17/27 ; G06N3/04
摘要:
本发明涉及一种基于神经机器翻译系统的单词预测方法及系统,所述单词预测方法包括:对平行语料进行训练,从训练结果中抽取,获得短语翻译表;对任意平行句对中的源语言句子进行匹配搜索,确定源语言句子中包含的全部源语言短语;从短语翻译表中查找各源语言短语分别对应的目标短语翻译候选集;根据目标短语翻译候选集及神经机器翻译系统翻译所得的部分译文,获得需要鼓励的目标单词集;根据基于神经机器翻译系统所得的注意力概率和目标短语翻译候选集,确定目标单词集中各目标单词的鼓励值;根据各目标单词的鼓励值,获得各目标单词的预测概率。通过引入短语翻译表获得目标单词的鼓励值,并添加到神经翻译模型中,从而可提高目标单词的预测概率。
公开/授权文献
- CN106844352A 基于神经机器翻译系统的单词预测方法及系统 公开/授权日:2017-06-13