-
公开(公告)号:CN110766091B
公开(公告)日:2024-02-27
申请号:CN201911049749.4
申请日:2019-10-31
申请人: 上海观安信息技术股份有限公司
摘要: 团伙。本发明实施例提供了一种套路贷团伙的识别方法及系统,方法包括:1)、获取套路贷运行过程中涉及到的特征数据;2)、将特征数据中包含的关键词作为节点,根据各个节点间的关系构建包括各个节点的关系图;3)、将关系图中的节点中的非人物节点收缩至对应于非人物节点的人物节点中;4)、根据各个人物节点之间边的类型确定边的权重的大小,将关系图划分为若干个节点集;5)、针对每一个节点集,将节点集与预先确定的套路贷犯罪分子的数据的重合程度,获取节点集中的节点为套路贷团伙成员的概率,并将概率大于预设阈值的节点集对应的人物作为套路
-
公开(公告)号:CN111754338B
公开(公告)日:2024-02-23
申请号:CN202010615836.8
申请日:2020-06-30
申请人: 上海观安信息技术股份有限公司
IPC分类号: G06F17/00 , G06Q40/02 , G06F16/951 , G06F16/958
摘要: 伙,兼顾了套路贷网站识别的广度和深度。本发明公开了一种套路贷团伙识别方法及系统,包括构建套路贷网站识别模型;根据套路贷网站黑名单库,获取套路贷网站的主要特征,并利用网络爬虫技术,爬取更多疑似套路贷网站的页面内容,并通过所述的套路贷网站识别模型进行识别,然后将识别为套路贷网站放入黑名单库中,得到新的黑名单库;针对新的黑名单库,通过套路贷网站的特征数据构建关系图,计算出每个特征节点所在的连通子图以及连通子图的节点数,最终识别团伙。本发明结合犯罪分子即贷款网站层面构建特征,挖掘潜在套路贷网站,并(56)对比文件冯胥睿瑞;刘嘉勇;程芃森.基于特征提取的恶意软件行为及能力分析方法研究.信息网络安全.2019,(12),78-84.杨奎河;刘智鹏.基于BERT-BiLSTM的短文本情感分析.信息通信.2020,(06),86-87.王庆广等.基于爬虫的有害网站发现与判别系统的实现《.信息网络安全》.2012,(第08期),
-
公开(公告)号:CN111754337B
公开(公告)日:2024-02-23
申请号:CN202010610974.7
申请日:2020-06-30
申请人: 上海观安信息技术股份有限公司
摘要: 本发明公开了一种信用卡养卡套现团体识别方法及系统,本发明依托于完善的银行、运营商及公安机关数据,使用均值移动聚类算法(MSC)识别出存在信用卡养卡套现的用户及作案人员,并通过知识图谱强大的特征挖掘能力找出与其关联的关键成员、重要成员,从而挖掘出犯罪团伙。本发明为银行及公安部门进行信用卡养卡套现犯罪活动的侦查提供了一个具有指导性和实践性的方案,为打击犯罪活动提供了有力的线索和证据,有利于信用卡行业的健康发展,并能在一定程度上遏制“洗钱”等不法行为的来源。(56)对比文件杨静等.基于聚类分析检索团伙多起犯罪的迭代算法《.计算机与现代化》.2013,(第01期),张芸芸等.基于Neo4j图谱的信用卡欺诈检测《.信息与电脑(理论版)》.2018,(第21期),凡友荣等.基于知识图谱的电信欺诈通联特征挖掘方法《.计算机应用与软件》.2019,第36卷(第11期),Omar Alonso.Social Knowledge GraphExplorer《.Proceedings of Proceedings ofthe 42nd International》.2019,Rutu Shukla等.A Survey Paper on MeanShift Algorithm to《.Second InternationalConference on Smart Systems and InventiveTechnology (ICSSIT 2019)》.2020,
-
公开(公告)号:CN111814436B
公开(公告)日:2023-10-17
申请号:CN202010731634.X
申请日:2020-07-27
申请人: 上海观安信息技术股份有限公司
IPC分类号: G06F40/151 , G06F40/216 , H04L67/02 , H04L9/40
摘要: 本发明提供一种基于互信息和熵的用户行为序列检测方法,基于web系统操作日志数据,根据用户行为序列,通过互信息及熵获得专业行为序列库,再通过行为序列的波动检测疑似异常用户的过程,一方面,该方法是一种无监督的方法,适应性较强,不需要业务经验,能够很快获得网站的专有行为序列库;另一方面,通过比较两个周期内行为序列库中行为序列的波动,从异常检测的目的出发,能够快速定位包含“未登录”或“热度”过高的行为序列的疑似异常用户,准确率较高,适应性、时效性较强,灵活性较高。
-
公开(公告)号:CN111666414B
公开(公告)日:2023-10-17
申请号:CN202010537941.4
申请日:2020-06-12
申请人: 上海观安信息技术股份有限公司
IPC分类号: G06F16/35 , G06F18/214 , G06F40/151 , G06N3/0442
摘要: 本发明公开了一种敏感数据检测云服务的方法及云服务平台,包括以下步骤:S01.企业上传训练样本,通过服务方开放的数据接口,企业将训练样本上传到服务方;S02.服务方使用训练样本进行模型训练,得到Bert+BiLSTM分类模型;S03.服务方使用Bert+BiLSTM分类模型对互联网文档进行预测,得到预测结果;S04.服务方将预测结果中的疑似文档返回给企业。本发明使用云服务的形式为企业提供敏感数据检测服务,降低企业获得服务的成本和门槛,避免重复投资;使得大中小型企业均可通过该服务获得相同标准的检测服务,整体提高网络数据的安全性,具有重大社会意义。
-
公开(公告)号:CN116401478A
公开(公告)日:2023-07-07
申请号:CN202310218929.0
申请日:2023-03-07
申请人: 上海观安信息技术股份有限公司
IPC分类号: G06F16/955 , G06F18/214 , G06F18/22
摘要: 本发明提供一种基于URL的API资产归并方法及系统,方法包括:获取主机访问记录日志数据;基于访问记录日志数据,提取URL,使用特定分隔符,对URI进行切分,形成词集合数组;根据词集合数据,按顺序,将两两词作为关系,词为节点,构建词关系图,计算词的出度、入度;根据前述步骤得到的出度、入度,通过指定阈值,选取出度或入度小于指定阈值的词;基于前述步骤得到的词,筛选出含有对应词URI,利用minhash计算出全量URI里面相似度较高URI;基于前述步骤选取的URI,计算选取对应词的支持度,如支持度小于指定阈值,则将该词替换成通配字符串,实现API规范化。本发明解决了API资产列表庞大、对人工操作经验依赖程度高的技术问题。
-
公开(公告)号:CN111752729B
公开(公告)日:2023-06-27
申请号:CN202010623557.6
申请日:2020-06-30
申请人: 上海观安信息技术股份有限公司
IPC分类号: G06F9/54 , G06F16/2458 , G06F16/28 , H04L67/02
摘要: 本发明提供了一种构建三层关联关系模型的方法,包括以下步骤:S1:提取记录用户访问情况的日志,并进行预处理;S2:对HTTP日志提取主体对象,得到HTTP请求,对HTTP请求和SQL日志中的SQL语句进行分解,并对分解后的HTTP请求和SQL语句分别进行匹配,存储匹配后的结构和参数;S3:基于时间顺序为每个HTTP请求结构匹配其后一段时间内发生的所有SQL结构,得到和序列;S4:基于关联规则算法计算得到HTTP请求和SQL语句的关联关系模型。本发明还提供了基于三层关联模型进行三层关系识别的方法。本发明的优点在于:基于时间序列和特征匹配构造关联关系模型;在统计的基础上挖掘请求和SQL的关系,提高识别的准确率;利用构建的模型对新的数据进行识别,时效性和准确性比较高。
-
公开(公告)号:CN110990867B
公开(公告)日:2023-02-07
申请号:CN201911193700.6
申请日:2019-11-28
申请人: 上海观安信息技术股份有限公司
IPC分类号: G06F21/62
摘要: 本发明提供一种基于数据库的数据泄露检测模型的建模方法、装置,泄露检测方法、系统,包括以下步骤:A、角色和用户组关系的建立:S100.数据采集,数据包括操作日志数据、用户角色数据、敏感数据列表;S200.解析SQL语句,提取表名;S300.数据关联及特征加工;S400.用户组的建立,定义用户组;S500.建立角色和用户组的关系;B、OneClassSvm模型训练:S600.正样本特征加工,S700.正样本中每个用户组对应一个OneClassSvm模型,并对该用户组内的第二宽表数据进行OneClassSvm模型训练,从而获得该用户组下正常数据的边界。本发明针基于数据库,对用户聚类出用户组,有别于提供的角色属性,这样可以保证用户的角色属性划分不合理的情况下,也可以科学的进行组内异常探索。
-
公开(公告)号:CN110933115B
公开(公告)日:2022-04-29
申请号:CN201911401991.3
申请日:2019-12-31
申请人: 上海观安信息技术股份有限公司
IPC分类号: H04L9/40
摘要: 本发明提供了一种基于动态session的分析对象行为异常检测方法及装置,方法包括:采集分析对象在业务系统中的操作日志;基于所述操作日志,针对每一个分析对象,根据所述分析对象对应的操作时间间隔是否大于预设时长获取各个时间间隔对应的间隔标记,获取所述分析对象对应的间隔特征;对所述间隔特征进行归一化处理,并将归一化后的间隔特征组合成针对所述分析对象的特征向量;将各个分析对象的特征向量作为SOS算法的输入,得到各个分析对象对应的异常概率值。本发明可以减少漏报。
-
公开(公告)号:CN110751231B
公开(公告)日:2022-04-29
申请号:CN201911044758.4
申请日:2019-10-30
申请人: 上海观安信息技术股份有限公司
摘要: 本发明实施例提供了一种基于无监督算法的养卡号码检测方法及系统,方法包括:1)、采集运营商电渠登录日志数据;2)、从登录日志数据中获取用户的登录行为特征,并将用户的登录行为特征作为第一特征集合,将对应于用户的登录行为特征的高维统计特征作为第二特征集合;3)、利用孤立森林算法识别出第一特征集合对应的各个异常群体;并使用聚类算法对第二特征集合中的特征进行聚类,得到若干个聚类,并根据登录行为特征的稳定性获取异常聚类;4)、根据异常群体所对应的号码中被聚类到异常聚类中的数量与,异常群体所对应的号码的比例,确定异常群体对应的号码是否属于养卡号码。应用本发明实施例,可以提高养卡号码识别的准确率。
-
-
-
-
-
-
-
-
-