-
公开(公告)号:CN108009219A
公开(公告)日:2018-05-08
申请号:CN201711166896.0
申请日:2017-11-21
Applicant: 国家计算机网络与信息安全管理中心 , 中科天玑数据科技股份有限公司
Abstract: 本发明公开了一种发现互联网金融舆情监管目标的方法,涉及互联网金融大数据领域。所述方法包括:实时获取备选互联网金融企业的网站地址,并将所述网站地址存储在网页待解析库中;对网页待解析库中新增的网站地址所对应的网页解析,得到备选互联网金融企业的名称,将验证成功后的名称作为互联网金融企业监测目标,完成发现互联网金融舆情监管目标。本发明所述方法自动发现互联网金融企业目标,找到其对应的网站地址,通过初期配置后自循环发现,不需要长期人工干预,通过长期运行有效地发现新增互联网金融企业目标。
-
公开(公告)号:CN113761318A
公开(公告)日:2021-12-07
申请号:CN202110484421.6
申请日:2021-04-30
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F16/953 , G06F16/33 , G06F40/216 , G06F40/289
Abstract: 本发明公开了一种网页风险发现的方法,包括下列步骤:S1、数据采集阶段,使用高效蔓延的基本原理,获取到网站大量的网页;S2、数据流转阶段,使用Confluent接入Kafka中数据,调用风险识别服务后,将数据存储至Elasticsearch中,完成整个数据流转;S3、风险识别阶段,针对采集到的数据进行分词,与风险规则库中数据进校对,将符合风险规则数据保存;S4、数据存储阶段,针对采集的原始数据进行处理,然后对处理后的数据,根据数据类型、规模、用途按需存储;S5、风险发现整体流程完成。有益效果:在海量网页数据中能够快速的定位风险网站。
-