Invention Publication
- Patent Title: 网页数据的处理方法及系统
-
Application No.: CN202211718807.XApplication Date: 2022-12-29
-
Publication No.: CN116150533APublication Date: 2023-05-23
- Inventor: 马龙飞 , 曾佳妮 , 徐蕙 , 陆斯悦 , 王立永 , 李香龙 , 丁屹峰 , 周文斌 , 高鑫 , 王健 , 胡彩娥
- Applicant: 国网北京市电力公司 , 国家电网有限公司
- Applicant Address: 北京市西城区前门西大街41号;
- Assignee: 国网北京市电力公司,国家电网有限公司
- Current Assignee: 国网北京市电力公司,国家电网有限公司
- Current Assignee Address: 北京市西城区前门西大街41号;
- Agency: 北京康信知识产权代理有限责任公司
- Agent 董文倩
- Main IPC: G06F16/958
- IPC: G06F16/958 ; G06F18/22 ; G06F40/289

Abstract:
本发明公开了一种网页数据的处理方法及系统。其中,该方法应用于分析领域,该方法包括:响应于预设网页的网页数据发生变化,获取预设网页的新网页数据;对新网页数据中的标题内容和正文内容分别进行处理,得到标题内容对应的关键词集合和正文内容对应的文本向量;基于关键词集合和文本向量,确定新网页数据的筛选系数;响应于筛选系数大于预设筛选系数,对新网页数据进行存储。本发明解决了筛选文本的匹配度较低的技术问题。
Information query