Invention Grant
- Patent Title: 一种使用本体进行文本文档自动分类的方法
- Patent Title (English): Method for automatically classifying text documents by utilizing body
-
Application No.: CN201010210107.0Application Date: 2010-06-24
-
Publication No.: CN101944099BPublication Date: 2012-05-30
- Inventor: 郭雷 , 方俊
- Applicant: 西北工业大学
- Applicant Address: 陕西省西安市友谊西路127号
- Assignee: 西北工业大学
- Current Assignee: 江苏天楹环保能源有限公司,西北工业大学
- Current Assignee Address: 陕西省西安市友谊西路127号
- Agency: 西北工业大学专利中心
- Agent 王鲜凯
- Main IPC: G06F17/30
- IPC: G06F17/30 ; G06F17/27
Abstract:
本发明涉及一种使用本体进行文本文档自动分类的方法,该方法包括:首先,使用带权重的关键词集合表示文本文档的特征信息;然后,使用经过本体消歧和本体扩展处理后的本体来表示分类目录的特征信息,并通过分析本体结构特征将本体被转化为带权重的词义集合;最后,使用Earth Mover’s Distance方法计算文本文档的关键词集合和本体权重词义集合之间的语义相似值,并进一步计算文本文档和分类目录之间的相似值,根据文本文档和分类目录之间的相似值来进行文本文档的分类和排序。使用本发明方法能够进行文本文档的自动分类,并提高文本文档分类的准确率。
Public/Granted literature
- CN101944099A 一种使用本体进行文本文档自动分类的方法 Public/Granted day:2011-01-12
Information query