发明公开
- 专利标题: 基于约束条件随机场的越南语名词组块识别方法
- 专利标题(英): Constraint conditional random field-based Vietnamese noun chunk identification method
-
申请号: CN201710883347.9申请日: 2017-09-26
-
公开(公告)号: CN107797994A公开(公告)日: 2018-03-13
- 发明人: 郭剑毅 , 李佳 , 余正涛 , 毛存礼 , 线岩团 , 陈玮
- 申请人: 昆明理工大学
- 申请人地址: 云南省昆明市五华区学府路253号
- 专利权人: 昆明理工大学
- 当前专利权人: 昆明理工大学
- 当前专利权人地址: 云南省昆明市五华区学府路253号
- 主分类号: G06F17/28
- IPC分类号: G06F17/28 ; G06F17/27 ; G06F17/30
摘要:
本发明涉及基于约束条件随机场的越南语名词组块识别方法,属于自然语言处理技术领域。本发明首先构建越南语名词组块语料库;从语料库中统计出名词组块的词性特点,制定出约束条件;其次运用条件随机场对名词组块语料进行训练,得到初步的条件随机场识别模型;再加入制定的约束条件,获得最终的约束条件随机场识别模型;根据名词组块识别模型参数序列来对越南语名词组块进行识别,得到最终识别结果序列。本发明对越南语名词组块实现了有效的识别,为词法分析、语义分析、信息抽取、信息检索和机器翻译等工作提供强有力的支撑。