发明公开
CN102314417A 基于统计模型的Web命名实体识别方法
无效 - 撤回
- 专利标题: 基于统计模型的Web命名实体识别方法
- 专利标题(英): Method for identifying Web named entity based on statistical model
-
申请号: CN201110284429.4申请日: 2011-09-22
-
公开(公告)号: CN102314417A公开(公告)日: 2012-01-11
- 发明人: 王静 , 刘志镜 , 曲建铭 , 王燕 , 贺文华 , 王炜华 , 王纵虎 , 陈东辉 , 姚勇 , 朱旭东 , 赵辉
- 申请人: 西安电子科技大学
- 申请人地址: 陕西省西安市太白南路2号
- 专利权人: 西安电子科技大学
- 当前专利权人: 西安电子科技大学
- 当前专利权人地址: 陕西省西安市太白南路2号
- 代理机构: 陕西电子工业专利中心
- 代理商 程晓霞; 王品华
- 主分类号: G06F17/27
- IPC分类号: G06F17/27
摘要:
本发明是一种基于统计模型的Web命名实体识别方法,用结构和文本特征对Web命名实体进行多特征表示;本发明将统计方法和规则方法相结合,采用改进的MR-GHMM来优化训练的效率;用改进隐马尔可夫的模型对实体进行标注,对各命名实体标注,实现实体识别;对Web复杂命名实体识别过程作为二层来处理,将第一层的标注结果作为第二层处理的输入进行复杂嵌套实体识别。本发明与原有识别算法相比,该算法的识别准确率提高了,模型训练的时间复杂度也大幅降低。通过对Web命名实体的多特征表示,针对不同领域的实体特征进行修改,就可以应用与Web上不同领域的命名实体进行识别。