- 专利标题: 基于开放知识库的短文本语义概念自动化扩展方法及系统
- 专利标题(英): Automatic short text semantic concept expansion method and system based on open knowledge base
-
申请号: CN201310081984.6申请日: 2013-03-14
-
公开(公告)号: CN103150382B公开(公告)日: 2015-04-01
- 发明人: 程学旗 , 刘盛华 , 肖永磊 , 王元卓 , 刘悦
- 申请人: 中国科学院计算技术研究所
- 申请人地址: 北京市海淀区中关村科学院南路6号
- 专利权人: 中国科学院计算技术研究所
- 当前专利权人: 中国科学院计算技术研究所
- 当前专利权人地址: 北京市海淀区中关村科学院南路6号
- 代理机构: 北京泛华伟业知识产权代理有限公司
- 代理商 王勇
- 主分类号: G06F17/30
- IPC分类号: G06F17/30
摘要:
本发明公开了一种基于开放知识库的短文本语义概念自动化扩展方法,所述方法将每条短文本生成的n-gram集合中的每个元素链接到开放知识库中与该元素最相关的概念,并且基于开放知识库的概念关系矩阵和所链接的概念,为该元素生成扩展的语义概念集合。该方法仅采用开放知识库文档中的锚文本信息而不采用文档的词项信息和目录信息来构建概念关系矩阵,这使得该矩阵的构造和计算方便,而且克服了目录信息粒度比较粗,歧义多的问题。而且在语义概念扩展阶段,采用基于上下文的语义相似度计算方法来进行语义概念扩展,同时考虑了短文本内容的上下文内容的一致性和概念在抽象语义层的相似性,提高了语义概念扩展的准确性。
公开/授权文献
- CN103150382A 基于开放知识库的短文本语义概念自动化扩展方法及系统 公开/授权日:2013-06-12