Invention Publication

网页数据的处理方法及系统
Abstract:
本发明公开了一种网页数据的处理方法及系统。其中,该方法应用于分析领域,该方法包括:响应于预设网页的网页数据发生变化,获取预设网页的新网页数据;对新网页数据中的标题内容和正文内容分别进行处理,得到标题内容对应的关键词集合和正文内容对应的文本向量;基于关键词集合和文本向量,确定新网页数据的筛选系数;响应于筛选系数大于预设筛选系数,对新网页数据进行存储。本发明解决了筛选文本的匹配度较低的技术问题。
Patent Agency Ranking
0/0