-
公开(公告)号:CN111488509A
公开(公告)日:2020-08-04
申请号:CN202010277162.5
申请日:2020-04-10
Applicant: 国家计算机网络与信息安全管理中心 , 哈尔滨工业大学(威海)
IPC: G06F16/951 , G06F16/955 , G06F16/9535 , G06Q30/02
Abstract: 本发明提供一种获取互联网金融广告的方法,包括以下步骤:(1)获取金融广告爬取网站及其链接;(2)打开步骤(1)中的网站和链接,获取网站中金融广告的URL;(3)根据步骤(2)的广告URL和图片src依照Adblock插件过滤规则编写过滤规则列表;(4)根据步骤(3)编写的过滤规则列表,将过滤规则列表保存进数据库;(5)根据步骤(1)中的网站,爬取网站内容,提取相应的url、图片src属性,然后将提取到的内容根据步骤(4)的过滤规则列表通过python的adblockparser解析器进行过滤获取金融广告;其解决了站内广告不规则站点无法使用统一的Xpath规则获取站内的所有广告内容的技术问题。本发明可广泛应用于获取网站内部及其子网站里的广告内容。
-
公开(公告)号:CN109447815A
公开(公告)日:2019-03-08
申请号:CN201811281377.3
申请日:2018-10-31
Applicant: 哈尔滨工业大学 , 国家计算机网络与信息安全管理中心
IPC: G06Q40/06
Abstract: 本发明涉及金融风险监测领域,具体的说是一种互联网金融平台信用风险监测雷达软件系统;包括股东变更次数指标模块、法人变更次数指标模块、高管变更次数指标模块、法人涉及民事诉讼次数指标模块以及经营者经营过其他问题平台指标模块,雷达图以正五边形的角展示上述各指标模块的指标,并依次连接正五边形的角与五边形中心,并在该线段上标注刻度,将各指数模块的指标得分分别标注在各自线段上,然后连接五大指标模块分数点,在正五边形内部形成另一五边形;采用本发明技术方案的软件系统,可以通过被标记的五边形的面积直观比较各个平台风险大小。
-
公开(公告)号:CN111538836B
公开(公告)日:2024-02-02
申请号:CN202010321249.8
申请日:2020-04-22
Applicant: 哈尔滨工业大学(威海) , 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F16/951 , G06F40/284 , G06F18/2431
Abstract: 本发明涉及一种识别文本类广告中金融广告的方法,其解决了现有广告分析模型无法有效识别金融广告的技术问题,其包括以下步骤:(1)从数据库中获取爬取到的广告文本数据;(2)对步骤(1)的文本数据进行预处理,进行分词以及去除无用信息;(3)将步骤(2)预处理后的文本通过不同的方式表示为计算机可以处理的方式,即文本表示;(4)针对步骤(3)的不同文本表示方式选择合适的分类算法,然后将文本表示的语义信息提炼成类别信息;(5)将步骤(4)中不同文本表示方式表示的分类模型进行整合,获得最终的金融广告识别模型。本发明可广泛应于在文本类广告中识别金融广告的场合。
-
公开(公告)号:CN112308696A
公开(公告)日:2021-02-02
申请号:CN202010100349.8
申请日:2020-02-18
Applicant: 哈尔滨工业大学 , 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及区域金融风险监测领域,具体涉及一种互联网金融企业区域风险测度方法;包括以下步骤,首先确定各种业态各个地区的资金集中度、杠杆率;再确定各种业态各地区资金集中度、杠杆率随时间变化的趋势;然后根据该种业态下行业资金集中度、行业杠杆率确定区域资金集中度及区域杠杆率黄线及红线;最后用弧形图展示各种业态下各地区的资金集中度及杠杆率风险所在风险水平,采用本发明技术方案的风险测度方法,可以对各种互联网金融业态下的各地区集中度、杠杆率随时间变化的趋势予以实时监测。
-
公开(公告)号:CN101834801A
公开(公告)日:2010-09-15
申请号:CN201010177960.7
申请日:2010-05-20
Applicant: 哈尔滨工业大学 , 国家计算机网络与信息安全管理中心
Abstract: 基于缓冲池的数据缓存排序在线处理方法,属于互联网领域,为了解决目前常见的多线程下载软件对于下载数据乱序和重复的节目批量并发下载,不能实现基于内存的下载数据在线缓存、排序和去重,因而无法支持实时在线的识别、检索等处理的问题。本发明将所有缓冲区组织成缓冲区池,采用多个缓冲区缓存同一节目的下载数据。在接收节目数据包后,先查询节目的下载日志,若无新数据则丢弃不做任何处理,否则:首先选择合适的节目已有缓冲区接收数据,若无合适缓冲区且允许的情况下,申请新缓冲区接收数据;然后更新下载日志;最后调用分析处理模块将该缓冲区中排好的数据取走处理。重复上述过程,直至节目下载完成,将节目分配的缓冲区释放到缓冲区池中。?
-
公开(公告)号:CN109472691A
公开(公告)日:2019-03-15
申请号:CN201811281448.X
申请日:2018-10-31
Applicant: 哈尔滨工业大学 , 国家计算机网络与信息安全管理中心
IPC: G06Q40/02
Abstract: 本发明涉及金融风险监测领域,具体的说是一种互联网金融企业异常预警排名方法及软件系统;包括有以下步骤,首先确定异常类型;确定每个异常类型下的异常指标;根据各异常类型下触发异常预警阈值的指标个数,确定该异常类型下各互联网金融企业的单项异常预警排名根据异常类型的个数对所有企业进行综合排序;采用本发明技术方案的异常预警排名方法,既能、从单个异常类型角度对所有互联网金融企业进行单项排名,也能从综合所有异常类型对所有互联网金融企业进行综合排名,便于使用者根据企业异常预警排名或是自己重点关注的异常类型的排名进行选择与决策。
-
公开(公告)号:CN107578193A
公开(公告)日:2018-01-12
申请号:CN201710945795.7
申请日:2017-10-12
Applicant: 国家计算机网络与信息安全管理中心 , 哈尔滨工业大学软件工程股份有限公司
Abstract: 本发明涉及互联网金融风险技术领域,具体涉及互联网金融风险分析可视化展示系统。所述互联网金融风险分析可视化展示系统包括:安全态势感知模块;风险监测模块;跟踪与分析模块。应用互联网金融风险分析可视化展示系统,实现互联网金融平台运行风险分析可视化,整体展示平台的公告异常、涉嫌虚假宣传、服务器境外部署等态势;实现互联网金融平台网络安全风险分析可视化,整体实现平台网站与APP安全态势展现,互联网金融平台舆情风险分析可视化,对平台运营风险进行深度剖析,呈现平台基本运营指数、动态实现平台健康度的评估。实现企业数据接入的互联网金融平台资金安全风险分析可视化,整体呈现平台资金的异常分析、流动、自融和自保等态势。
-
公开(公告)号:CN101834801B
公开(公告)日:2012-11-21
申请号:CN201010177960.7
申请日:2010-05-20
Applicant: 哈尔滨工业大学 , 国家计算机网络与信息安全管理中心
Abstract: 基于缓冲池的数据缓存排序在线处理方法,属于互联网领域,为了解决目前常见的多线程下载软件对于下载数据乱序和重复的节目批量并发下载,不能实现基于内存的下载数据在线缓存、排序和去重,因而无法支持实时在线的识别、检索等处理的问题。本发明将所有缓冲区组织成缓冲区池,采用多个缓冲区缓存同一节目的下载数据。在接收节目数据包后,先查询节目的下载日志,若无新数据则丢弃不做任何处理,否则:首先选择合适的节目已有缓冲区接收数据,若无合适缓冲区且允许的情况下,申请新缓冲区接收数据;然后更新下载日志;最后调用分析处理模块将该缓冲区中排好的数据取走处理。重复上述过程,直至节目下载完成,将节目分配的缓冲区释放到缓冲区池中。
-
公开(公告)号:CN111538836A
公开(公告)日:2020-08-14
申请号:CN202010321249.8
申请日:2020-04-22
Applicant: 哈尔滨工业大学(威海) , 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F16/951 , G06F40/284 , G06K9/62
Abstract: 本发明涉及一种识别文本类广告中金融广告的方法,其解决了现有广告分析模型无法有效识别金融广告的技术问题,其包括以下步骤:(1)从数据库中获取爬取到的广告文本数据;(2)对步骤(1)的文本数据进行预处理,进行分词以及去除无用信息;(3)将步骤(2)预处理后的文本通过不同的方式表示为计算机可以处理的方式,即文本表示;(4)针对步骤(3)的不同文本表示方式选择合适的分类算法,然后将文本表示的语义信息提炼成类别信息;(5)将步骤(4)中不同文本表示方式表示的分类模型进行整合,获得最终的金融广告识别模型。本发明可广泛应于在文本类广告中识别金融广告的场合。
-
公开(公告)号:CN109657114B
公开(公告)日:2023-11-03
申请号:CN201810953361.6
申请日:2018-08-21
Applicant: 国家计算机网络与信息安全管理中心 , 中科国力(镇江)智能技术有限公司
IPC: G06F16/951 , G06F16/9535 , G06F16/81
Abstract: 本发明公开了一种抽取网页半结构化数据的方法,包括:从web站点爬取页面;人工定制化爬取目标页的url;配置一类网站的关键词词根;对类似的网页进行分析,根据case1,case2,case3进行分类判别,并对复杂的嵌套情况加以处理,抽取出网页模板。通过指定的url选出同类(栏目)url,同栏目url对应的html文本结构相似,遍历所有html节点,通过节点间的联系或节点本身,发现对应关键词的模板。从一个网站的所有子url中,找出和人工给定的相似的url。把目标格式分为case1,case2,case3,三种情况,对每一种情况分别进行处理,生成网页模板。
-
-
-
-
-
-
-
-
-