基于K-Means算法改进的高频职业技能生命曲线聚类方法
摘要:
本发明公开了一种基于K-Means算法改进的高频职业技能生命曲线聚类方法,其特征在于,包括以下步骤:1)爬取用户信息形成用户文档库;2)挖掘高频职业技能;3)构建高频职业技能生命曲线;4)使用密度峰算法选取K个职业技能生命曲线聚类中心;5)使用K-Means算法对职业技能生命曲线进行聚类;6)采用戴维森堡丁指数评估聚类结果,评估不合格,增加职业技能生命曲线聚类中心的数量K,返回步骤4,评估合格则进入下一步;7)得到最终高频职业技能生命曲线聚类结果。本发明通过对高频职业技能生命曲线进行定义,使用密度峰算法选取合适聚类中心点,然后使用K-Means算法进行聚类,进而比较稳定有效的找出生命曲线相似的职业技能。
0/0