发明公开
CN111061878A 一种页面聚类方法、装置、介质及设备
无效 - 撤回
- 专利标题: 一种页面聚类方法、装置、介质及设备
-
申请号: CN201911279107.3申请日: 2019-12-12
-
公开(公告)号: CN111061878A公开(公告)日: 2020-04-24
- 发明人: 丁柳朋
- 申请人: 杭州昕华信息科技有限公司
- 申请人地址: 浙江省杭州市滨江区西兴街道物联网街369号B幢六层B613室
- 专利权人: 杭州昕华信息科技有限公司
- 当前专利权人: 杭州昕华信息科技有限公司
- 当前专利权人地址: 浙江省杭州市滨江区西兴街道物联网街369号B幢六层B613室
- 主分类号: G06F16/35
- IPC分类号: G06F16/35 ; G06F16/957
摘要:
本发明公开了一种页面聚类方法、装置、介质及设备,包括获取待聚类的页面的页面属性集;根据所述页面属性集计算每个页面与其它页面的差异度,构建差异度图;获取聚类目标值N;根据所述差异度图和所述聚类目标值计算目标差异度;根据所述目标差异度对所述待聚类页面进行聚类,得到N个类,以使得位于相同类中的页面的差异度均不大于目标聚类差异度,而位于不同的类中的任意两个页面的差异度均大于所述目标聚类差异度。本发明可以快速精准的确定最适宜的目标差异度,并将目标差异度作为聚类基准,从而得到更为精准的聚类结果,为后续的数据分析奠定了基础。