网站社区划分方法、装置、计算机设备、存储介质

    公开(公告)号:CN117786228A

    公开(公告)日:2024-03-29

    申请号:CN202410035293.0

    申请日:2024-01-08

    摘要: 本申请涉及一种网站社区划分方法、装置、计算机设备、存储介质和计算机程序产品。该方法可以应用于对车载终端、云服务器或区块链节点中的目标网站进行网站社区划分的应用场景,包括:响应于网站社区查询请求,对网站社区查询请求指定的目标网站进行网址关系链扩散,得到扩散网站;通过模拟器访问目标网站和扩散网站,并基于模拟器发起的各资源请求生成目标网站的第一资源请求列表和扩散网站的第二资源请求列表;基于第一资源请求列表和第二资源请求列表生成多个网站指纹;对各网站指纹进行距离计算得到距离信息,并基于距离信息对各网站指纹进行社区划分,得到目标网站所属的网站社区。采用本方法能够有效提高所划分的网站社区的准确性。

    一种目标网址的识别方法和相关装置

    公开(公告)号:CN117278284A

    公开(公告)日:2023-12-22

    申请号:CN202311256365.6

    申请日:2023-09-26

    摘要: 本申请公开一种目标网址的识别方法和相关装置,可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景。将网址访问关系按照访问时间进行链路构建得到网址时序关系访问链,并基于网址时序关系访问链进行特征提取,得到链路特征。为了识别出目标网址,可以先基于链路特征对网址时序关系访问链进行聚类得到聚类结果。若聚类结果指示网址时序关系访问链符合目标链路模式,则确定网址时序关系访问链是目标链路。该网址时序关系访问链上的网址可能存在目标网址,故计算网址时序关系访问链中每个网址的识别指标值,将识别指标值满足预设识别条件的网址确定为目标网址。本申请无需关注打开网址后的具体内容,避免因种子失效导致识别漏过等问题。

    通信号码的风险识别方法、装置、计算机设备和存储介质

    公开(公告)号:CN116975592A

    公开(公告)日:2023-10-31

    申请号:CN202310755922.2

    申请日:2023-06-25

    IPC分类号: G06F18/213 G06F18/2433

    摘要: 本申请涉及一种通信号码的风险识别方法、装置、计算机设备、存储介质和计算机程序产品,所述方法可应用于人工智能领域,所述方法包括:对待识别通信号码进行风险行为识别,得到第一识别结果;当所述第一识别结果表征所述待识别通信号码不满足预设风险条件时,获取所述待识别通信号码所属的号码序列;基于所述号码序列,提取所述待识别通信号码的号码时序特征和所述号码序列中其他通信号码的号码时序特征;对各所述号码时序特征进行异常点检测,得到异常号码时序特征;根据所述异常号码时序特征确定所述待识别通信号码的第二识别结果。采用本方法能够提高对通信号码的风险识别准确率。

    异常网页检测方法、装置、计算机设备和存储介质

    公开(公告)号:CN116975487A

    公开(公告)日:2023-10-31

    申请号:CN202211403484.5

    申请日:2022-11-10

    摘要: 本申请涉及一种异常网页检测方法、装置、计算机设备、存储介质和计算机程序产品。涉及人工智能领域,可应用于车载场景。所述方法通过先获取每一已标注网页图像的图像低维特征和图像高维特征,而后将各图像低维特征的特征聚类结果与各图像高维特征的特征聚类结果进行匹配,得到特征聚类结果匹配对,再基于特征聚类结果匹配对,确定各已标注网页图像的图像聚类结果,并分别构造各已标注网页图像的聚类特征向量,通过聚类特征向量对未标注网页图像进行异常检测,得到异常网页检测结果。本申请通过差异化内容特征提取的聚类方法,融合了图像低维特征与图像高维特征,从而得到更加精准、丰富的聚类结果,提高基于聚类进行异常网页检测的准确性。

    识别异常网站的训练方法、装置及存储介质

    公开(公告)号:CN118114074A

    公开(公告)日:2024-05-31

    申请号:CN202211515292.3

    申请日:2022-11-29

    摘要: 本申请公开了一种识别异常网站的训练方法、装置及存储介质,可以应用于云技术、人工智能、智慧交通、车联网等各种场景,该方法包括:获取样本网站集对应的样本域名集;样本域名集包括正样本域名以及负样本域名;确定样本域名集中各个样本域名对应的域名属性特征;基于样本域名集对应的多个域名属性特征进行聚类,得到多个类簇;根据多个类簇各自对应的域名属性特征,确定目标类簇;将目标类簇对应的正样本域名的标签,更新为异常类别标签,得到更新样本域名集;根据更新样本域名集训练预设模型,得到异常网站识别模型。本申请得到异常网站识别模型可以提高异常网站的检测准确率。

    异常信息的检测方法、装置、设备及存储介质

    公开(公告)号:CN115834244B

    公开(公告)日:2024-02-20

    申请号:CN202211739519.2

    申请日:2022-12-30

    IPC分类号: H04L9/40

    摘要: 本申请公开了一种异常信息的检测方法、装置、设备及存储介质,属于互联网技术领域。方法包括:获取多个第一传播信息,第一传播信息包括平台账号和关键信息,多个第一传播信息包括第一异常信息,第一异常信息为异常的平台账号或者异常的关键信息;基于多个第一传播信息和各个第一异常信息的初始异常指标确定目标传播图;基于目标传播图确定第二异常信息,第二异常信息是目标传播图中平台账号的目标异常指标大于第一指标阈值的节点所对应的平台账号,或者,是目标传播图中关键信息的目标异常指标大于第二指标阈值的节点所对应的关键信息。本申请实现了基于目标传播图确定异常的平台账号和异常的关键信息,提高了网络安全性。

    信息展示方法、装置、计算机设备和存储介质

    公开(公告)号:CN116915893A

    公开(公告)日:2023-10-20

    申请号:CN202310884091.9

    申请日:2023-07-18

    摘要: 本申请涉及一种信息展示方法、装置、计算机设备、存储介质和计算机程序产品。所述方法可应用于云计算技术领域,包括:获取目标通信号码在各信息源下的号码信息和各信息源的反馈指标值;反馈指标值是基于通信号码在各信息源下的号码信息的反馈信息进行动态调整所得;根据反馈指标值确定各信息源对应的来源优先级;在各信息源中,获取来源优先级满足优先级条件的目标信息源,并基于目标信息源下的号码信息选取匹配的信息源;依据目标信息源对应的来源优先级和匹配的信息源对应的来源优先级,确定目标通信号码对应的号码优先级;依据号码优先级和来源优先级,对各信息源下的号码信息进行展示。采用本方法能够提高号码信息的展示的准确性。

    恶意账户识别方法、装置及存储介质

    公开(公告)号:CN110232630B

    公开(公告)日:2024-09-27

    申请号:CN201910455922.4

    申请日:2019-05-29

    发明人: 牛亚峰

    IPC分类号: G06Q40/03

    摘要: 本申请实施例公开了一种恶意账户识别方法、装置及存储介质,其中恶意账户识别方法包括:获取不同时间点下目标账户的账户使用信息和设备使用信息;对账户使用信息和设备使用信息进行特征提取,得到多个账户节点特征和多个设备节点特征;按照时间顺序构建多个账户节点特征和多个设备节点特征之间的节点关联关系;基于节点关联关系,以指定时间点下目标账户的采样得到的账户节点特征为中心进行节点特征采样,得到关联节点特征;根据采样得到的账户节点特征和关联节点特征,识别目标账户是否为恶意账户。本申请方案可利用时间流转带来的时序信息、及采样得到的周围邻居节点特征识别恶意账户,可及时识别出恶意账户,并有效提升恶意账户的识别准确率。

    网站社区划分方法、装置、计算机设备、存储介质

    公开(公告)号:CN117786229A

    公开(公告)日:2024-03-29

    申请号:CN202410036430.2

    申请日:2024-01-08

    摘要: 本申请涉及一种网站社区划分方法、装置、计算机设备、存储介质和计算机程序产品。该方法可以应用于对车载终端、云服务器或区块链节点中的目标网站进行网站社区划分的应用场景,包括:响应于网站社区查询请求,对所述网站社区查询请求指定的目标网站进行网址关系链扩散,得到扩散网站;基于所述目标网站和所述扩散网站的网址记录,生成所述目标网站的第一分级目录和所述扩散网站的第二分级目录;基于所述第一分级目录和所述第二分级目录生成多个网站指纹;对各所述网站指纹进行距离计算得到距离信息,并基于所述距离信息对各所述网站指纹进行社区划分,得到所述目标网站所属的网站社区。采用本方法能够有效提高所划分的网站社区的准确性。

    网站指纹生成方法、相似网站识别方法、装置和设备

    公开(公告)号:CN116975488A

    公开(公告)日:2023-10-31

    申请号:CN202310539577.9

    申请日:2023-05-12

    摘要: 本申请涉及一种网站指纹生成方法、相似网站识别方法、装置、计算机设备、存储介质和计算机程序产品。该网站指纹生成方法包括:获取目标网站的网站标识、以及该目标网站所传播的每一网站资源各自的资源地址;对每一资源地址分别进行资源标识提取,获得每一资源地址各自的资源标识;该资源标识包括一个标识串或通过分隔符连接的多个标识串;针对每一标识串,对该标识串进行目录转换处理,确定该标识串对应的资源目录;对每一资源目录分别进行编码处理,获得每一资源目录各自对应的编码序列;基于各编码序列,生成唯一表征目标网站的网站指纹。采用本方法所生成的网站指纹能更加全面地表征目标网站的特点,可以提高网站指纹的准确性。