发明公开
- 专利标题: 基于K-Means算法改进的高频职业技能生命曲线聚类方法
-
申请号: CN201911030748.5申请日: 2019-10-28
-
公开(公告)号: CN110889431A公开(公告)日: 2020-03-17
- 发明人: 陈冲 , 司华友 , 万健 , 吴浩鹏 , 张伟
- 申请人: 杭州电子科技大学
- 申请人地址: 浙江省杭州市下沙高教园区2号大街
- 专利权人: 杭州电子科技大学
- 当前专利权人: 杭州电子科技大学
- 当前专利权人地址: 浙江省杭州市下沙高教园区2号大街
- 代理机构: 杭州君度专利代理事务所
- 代理商 诸佩艳
- 主分类号: G06K9/62
- IPC分类号: G06K9/62 ; G06Q50/00
摘要:
本发明公开了一种基于K-Means算法改进的高频职业技能生命曲线聚类方法,其特征在于,包括以下步骤:1)爬取用户信息形成用户文档库;2)挖掘高频职业技能;3)构建高频职业技能生命曲线;4)使用密度峰算法选取K个职业技能生命曲线聚类中心;5)使用K-Means算法对职业技能生命曲线进行聚类;6)采用戴维森堡丁指数评估聚类结果,评估不合格,增加职业技能生命曲线聚类中心的数量K,返回步骤4,评估合格则进入下一步;7)得到最终高频职业技能生命曲线聚类结果。本发明通过对高频职业技能生命曲线进行定义,使用密度峰算法选取合适聚类中心点,然后使用K-Means算法进行聚类,进而比较稳定有效的找出生命曲线相似的职业技能。