- 专利标题: 跨语言的词汇义原预测方法、装置与电子设备
-
申请号: CN201811288136.1申请日: 2018-10-31
-
公开(公告)号: CN109597988B公开(公告)日: 2020-04-28
- 发明人: 孙茂松 , 岂凡超 , 林衍凯 , 朱昊 , 谢若冰 , 刘知远
- 申请人: 清华大学
- 申请人地址: 北京市海淀区清华园北京100084-82信箱
- 专利权人: 清华大学
- 当前专利权人: 清华大学
- 当前专利权人地址: 北京市海淀区清华园北京100084-82信箱
- 代理机构: 北京路浩知识产权代理有限公司
- 代理商 王莹; 吴欢燕
- 主分类号: G06F40/284
- IPC分类号: G06F40/284 ; G06F40/289 ; G06F40/30
摘要:
本发明实施例提供一种跨语言的词汇义原预测方法、装置与电子设备,该方法包括:分别确定源语言词向量和目标语言词向量学习的损失函数;分别确定词向量对齐和融入义原信息的损失函数;基于源语言和目标语言的单语语料,选取一定数量具有相同语义的源语言词与目标语言词对;基于源语言词与目标语言词对和源语言内已建立的义原知识库,对上述各损失函数进行优化,获取同属一个语义空间的双语词向量;基于双语词向量,通过搜索与目标语言中目标词汇词向量相近的源语言词的已标注义原,为目标词汇进行义原预测。本发明实施例能够合理利用已有义原知识库为跨语言词汇进行义原预测,从而有效节约义原预测的人力和时间成本。
公开/授权文献
- CN109597988A 跨语言的词汇义原预测方法、装置与电子设备 公开/授权日:2019-04-09