一种页面聚类方法、装置、介质及设备
摘要:
本发明公开了一种页面聚类方法、装置、介质及设备,包括获取待聚类的页面的页面属性集;根据所述页面属性集计算每个页面与其它页面的差异度,构建差异度图;获取聚类目标值N;根据所述差异度图和所述聚类目标值计算目标差异度;根据所述目标差异度对所述待聚类页面进行聚类,得到N个类,以使得位于相同类中的页面的差异度均不大于目标聚类差异度,而位于不同的类中的任意两个页面的差异度均大于所述目标聚类差异度。本发明可以快速精准的确定最适宜的目标差异度,并将目标差异度作为聚类基准,从而得到更为精准的聚类结果,为后续的数据分析奠定了基础。
0/0