一种使用本体进行文本文档自动分类的方法
Abstract:
本发明涉及一种使用本体进行文本文档自动分类的方法,该方法包括:首先,使用带权重的关键词集合表示文本文档的特征信息;然后,使用经过本体消歧和本体扩展处理后的本体来表示分类目录的特征信息,并通过分析本体结构特征将本体被转化为带权重的词义集合;最后,使用Earth Mover’s Distance方法计算文本文档的关键词集合和本体权重词义集合之间的语义相似值,并进一步计算文本文档和分类目录之间的相似值,根据文本文档和分类目录之间的相似值来进行文本文档的分类和排序。使用本发明方法能够进行文本文档的自动分类,并提高文本文档分类的准确率。
Public/Granted literature
Patent Agency Ranking
0/0