摘要:
本发明涉及基于改进的Nivre算法构建越南语依存树库的方法,属自然语言处理技术领域。本发明首先构建初始训练语料、扩展语料和测试语料;然后利用构建的初始训练语料基于改进的Nivre算法训练出两个依存分析弱学习器S1和S2作为两个充分冗余的视图;再利用训练出的两个弱学习器S1和S2对扩展语料进行依存分析并构建越南语依存树库模型;最后对测试语料进行依存分析测试并最终构建出越南语依存树库。本发明能够对越南语的句法分析、机器翻译和信息获取等上层应用提供有力支撑;能有效避免了人工标记越南语句子依存关系的过程,节省了人力物力的时间;能够有效利用大量无标记的越南语句子级语料提升依存分析的准确率。
公开/授权文献
- CN106250367A 基于改进的Nivre算法构建越南语依存树库的方法 公开/授权日:2016-12-21