发明公开
- 专利标题: 自动判断检索机器翻译数据库时机的方法及存储介质
-
申请号: CN202210794321.8申请日: 2022-07-07
-
公开(公告)号: CN115034240A公开(公告)日: 2022-09-09
- 发明人: 黄书剑 , 朱文昊 , 吕云哲 , 戴新宇 , 张建兵 , 陈家骏
- 申请人: 南京大学
- 申请人地址: 江苏省南京市栖霞区仙林大道163号
- 专利权人: 南京大学
- 当前专利权人: 南京大学
- 当前专利权人地址: 江苏省南京市栖霞区仙林大道163号
- 代理机构: 苏州汇诚汇智专利代理事务所
- 代理商 张聪
- 主分类号: G06F40/58
- IPC分类号: G06F40/58 ; G06K9/62 ; G06N5/02 ; G06N3/04 ; G06N3/08
摘要:
本发明公开了自动判断检索机器翻译数据库时机的方法,方法包括如下步骤:将数据库中的知识划分为被掌握的知识和没被掌握的知识;根据数据库中局部空间内知识的掌握情况,为不同的知识确定知识边界值;将数据库中知识的知识边界值情况作为训练数据,训练一个轻量的多层感知机网络模型,通过多层感知机网络模型预测隐层表示对应的的知识边界值情况;解码翻译目标领域文本时,使用通用领域翻译模型得到翻译上下文的隐层表示之后,根据知识边界值情况,判断通用领域翻译模型在每个解码步时是否需要检索数据库。本发明避免了通用领域翻译模型在每个解码步时不必要的检索行为,在应用不同语言和领域的数据库时,可以自动判断检索时机。