发明授权
- 专利标题: 汉语词法分析方法
-
申请号: CN201310421538.5申请日: 2013-09-16
-
公开(公告)号: CN103473221B公开(公告)日: 2016-11-30
- 发明人: 于江德 , 刘运通 , 王希杰 , 胡顺义 , 郑霞 , 葛彦强 , 王继鹏
- 申请人: 于江德 , 刘运通 , 王希杰
- 申请人地址: 河南省安阳市弦歌大道436号安阳师范学院计算机与信息工程学院
- 专利权人: 于江德,刘运通,王希杰
- 当前专利权人: 安阳师范学院
- 当前专利权人地址: 河南省安阳市弦歌大道436号安阳师范学院计算机与信息工程学院
- 代理机构: 北京同辉知识产权代理事务所
- 代理商 赵慧
- 主分类号: G06F17/27
- IPC分类号: G06F17/27
摘要:
本发明是一种汉语词法分析方法,包括以下步骤:1)从一给定的训练语料中获得特征函数和权重;2)切分输入的汉语文本:将输入的汉语文本切分为多个语句,一个语句为一个字序列;3)计算输入的汉语文本对应的字序列的所有可能的词法信息标记序列的条件概率;4)确定输入的汉语文本对应的字序列的最终的词法信息标记序列;5)进行汉语分词、汉语词性标注和汉语命名实体识别,从而获得最终的汉语词法分析结果。本发明将汉语词法分析的三项子任务统一到字序列标注框架中实现,克服了错误向上传递放大累加,多类信息难以整合利用的不足,计算简单、运算量小;完全脱离词典,对未登录词语也能较好的切分和标注。
公开/授权文献
- CN103473221A 汉语词法分析方法 公开/授权日:2013-12-25