融入语言差异化特征的汉越神经机器翻译译文质量估计方法
摘要:
本发明提出融入语言差异化特征的汉越神经机器翻译译文质量估计方法,属于自然语言处理技术领域。本发明首先采用统计对齐的方法对汉越之间结构差异进行建模,将其定义为汉语与越南语之间的语言差异化特征。其次,将提取到的语言差异化特征与质量估计模型进行结合,其融合过程为将定义的特征作为惩罚因子同双向LSTM模型中最后一个时刻两个方向的隐状态进行结合,最终使得基于大规模双语数据的通用型译文质量估计模型能够有效地对汉‑越这种资源稀缺型译文质量估计任务有更好的关注,有效地提升译文质量估计模型对于汉越神经机器翻译任务的性能。
0/0