发明公开
- 专利标题: 适用于大数据分析互联网数据抓取方法
-
申请号: CN202010212831.0申请日: 2020-03-24
-
公开(公告)号: CN111460253A公开(公告)日: 2020-07-28
- 发明人: 相辉 , 张永力 , 苏睿清 , 张弘媛 , 蔡鹏飞 , 张静 , 卢焱 , 杨青卓 , 李昊兰
- 申请人: 国家电网有限公司 , 国网河北省电力有限公司物资分公司 , 国网河北招标有限公司
- 申请人地址: 北京市西城区西长安街86号
- 专利权人: 国家电网有限公司,国网河北省电力有限公司物资分公司,国网河北招标有限公司
- 当前专利权人: 国家电网有限公司,国网河北省电力有限公司物资分公司,国网河北招标有限公司
- 当前专利权人地址: 北京市西城区西长安街86号
- 代理机构: 北京慕达星云知识产权代理事务所
- 代理商 符继超
- 主分类号: G06F16/951
- IPC分类号: G06F16/951 ; G06F16/953
摘要:
本发明公开了适用于大数据分析互联网数据抓取方法,包括以下步骤:S1,数据获取终端产生应用数据,数据获取终端将各种应用软件平台使用后和预览网站后产生的数据传送到对应厂商的服务器和云端数据库内,或者是保存在第三方云端数据库内;S2,服务器和云端数据库内保存的应用数据会进行甄别分析,数据甄别分析会将数据与通用信息库内储存的信息进行对比,作为第一步程序筛选;S3,机选后产生三种判断结果,第一种是与通用信息库数据对比后无疑义的信息会直接通过平台和网站反馈给客户。本发明将储存的数据进行程序筛选和人工筛选,由此提高了数据的价值性,减低假冒诈骗的信息的流传,从而有利于产业的健康发展。