一种仿冒网站监测识别方法及系统
摘要:
本发明公开了一种仿冒网站监测识别方法及系统,方法包括:S1、分别对被仿冒网站和待检测网站进行页面解析,得到解析后的被仿冒网页和待检测网页;S2、分别对解析后的被仿冒网页和待检测网页进行特征提取,得到被仿冒网页和待检测网页的网页特征;S3、计算被仿冒网页与待检测网页的网页特征的相似性,得到对应于网页特征中所有特征的所有计算结果;S4、对所有计算结果进行集成汇总,得到集成汇总结果;S5、将集成汇总结果与预设阈值进行比较,如果集成汇总结果大于预设阈值,则待检测网站为仿冒网站。本发明的有益效果是:同时考虑了网页URL、网页内容以及网页图像的相似性,并对三个相似性进行集成汇总,提高对仿冒网站进行识别的准确性。
0/0