发明授权
CN100583101C 基于领域知识的文本分类特征选择及权重计算方法
失效 - 权利终止
- 专利标题: 基于领域知识的文本分类特征选择及权重计算方法
- 专利标题(英): Text categorization feature selection and weight computation method based on field knowledge
-
申请号: CN200810058517.0申请日: 2008-06-12
-
公开(公告)号: CN100583101C公开(公告)日: 2010-01-20
- 发明人: 余正涛 , 韩露 , 向凤红 , 万舟 , 熊新
- 申请人: 昆明理工大学
- 申请人地址: 云南省昆明市五华区学府路253号
- 专利权人: 昆明理工大学
- 当前专利权人: 昆明理工大学
- 当前专利权人地址: 云南省昆明市五华区学府路253号
- 代理机构: 昆明正原专利代理有限责任公司
- 代理商 金耀生
- 主分类号: G06F17/30
- IPC分类号: G06F17/30 ; G06F17/27 ; G06N1/00
摘要:
本发明涉及人工智能技术领域,特别是一种基于领域知识的文本分类特征选择及权重计算方法。该方法结合样本统计与领域术语构造领域分类特征空间,利用领域内部知识关系,计算术语间的相似度,依此来调整分类特征向量相应特征维权重。并采用支持向量机学习算法,建立领域文本分类模型,实现领域文本分类。云南旅游领域与非旅游领域文本分类实验结果表明,该方法分类准确率比改进TFIDF特征权重方法的文本分类效果提高了4个百分点。
公开/授权文献
- CN101290626A 基于领域知识的文本分类特征选择及权重计算方法 公开/授权日:2008-10-22