发明公开
CN105630776A 一种双向词语对齐方法及装置
无效 - 驳回
- 专利标题: 一种双向词语对齐方法及装置
- 专利标题(英): Bidirectional term aligning method and device
-
申请号: CN201510998012.2申请日: 2015-12-25
-
公开(公告)号: CN105630776A公开(公告)日: 2016-06-01
- 发明人: 孙茂松 , 柳春洋 , 刘洋 , 栾焕博 , 刘奕群 , 马少平
- 申请人: 清华大学
- 申请人地址: 北京市海淀区清华园北京100084-82信箱
- 专利权人: 清华大学
- 当前专利权人: 清华大学
- 当前专利权人地址: 北京市海淀区清华园北京100084-82信箱
- 代理机构: 北京路浩知识产权代理有限公司
- 代理商 李相雨
- 主分类号: G06F17/28
- IPC分类号: G06F17/28
摘要:
本发明涉及一种双向词语对齐方法及装置,其中,方法包括构建源语言到目标语言的第一词语对齐模型和目标语言到源语言的第二词语对齐模型;利用一致性评估函数,融合两个方向的词语对齐模型,构建初始目标函数;利用一致性评估函数,对两个方向的词语对齐模型进行联合训练,形成优化目标函数;利用优化目标函数及联合训练得到的模型,对平行双语句对进行词语对齐,得到双向词语对齐结果。系统包括词语对齐模型构建模块、目标函数构建模块、联合训练模块、词语对齐分析模块。通过本发明提供方法及装置,由于引入了一致性评估函数,能对两个方向的词语对齐模型进行联合训练,使两个方向的词语对齐模型相互纠错,极大的降低了词语对齐的错误率。