发明公开
- 专利标题: 融入语言差异化特征的汉越神经机器翻译译文质量估计方法
-
申请号: CN202111116100.7申请日: 2021-09-23
-
公开(公告)号: CN114004238A公开(公告)日: 2022-02-01
- 发明人: 余正涛 , 王冠文 , 朱俊国 , 高盛祥 , 邹翔
- 申请人: 昆明理工大学
- 申请人地址: 云南省昆明市五华区学府路253号
- 专利权人: 昆明理工大学
- 当前专利权人: 昆明理工大学
- 当前专利权人地址: 云南省昆明市五华区学府路253号
- 代理机构: 昆明人从众知识产权代理有限公司
- 代理商 何娇
- 主分类号: G06F40/58
- IPC分类号: G06F40/58 ; G06F40/289 ; G06F40/253 ; G06F40/242 ; G06F40/211 ; G06N3/04 ; G06N3/08
摘要:
本发明提出融入语言差异化特征的汉越神经机器翻译译文质量估计方法,属于自然语言处理技术领域。本发明首先采用统计对齐的方法对汉越之间结构差异进行建模,将其定义为汉语与越南语之间的语言差异化特征。其次,将提取到的语言差异化特征与质量估计模型进行结合,其融合过程为将定义的特征作为惩罚因子同双向LSTM模型中最后一个时刻两个方向的隐状态进行结合,最终使得基于大规模双语数据的通用型译文质量估计模型能够有效地对汉‑越这种资源稀缺型译文质量估计任务有更好的关注,有效地提升译文质量估计模型对于汉越神经机器翻译任务的性能。