基于公开数据源的ICT供应链关系画像

    公开(公告)号:CN112100235A

    公开(公告)日:2020-12-18

    申请号:CN202010811447.2

    申请日:2020-08-13

    摘要: 本发明涉及一种基于公开数据源的供应关系画像方法,属于自然语言处理与机器学习领域。主要为了开展国内ICT供应链安全风险问题研究,支撑我国网络空间安全战略落地。本发明首先获取招投标网站公开数据源,针对获取的不同类型附件,编写对应处理脚本,提取附件文本信息;后对每条数据进行结构化,抽取多维属性信息;再使用ICT产品词典过滤,构建ICT领域招投标数据库;然后结合实体匹配技术,挖掘多层级供应关系;最后进行供应链归并聚合,建立招标、产品、中标供应关系画像。该方法在建立的ICT招投标数据库的基础上,构建多个行业、多种产品的供应链关系画像,ICT相关采购数据覆盖率达98%,ICT供应链信息准确率达96%。

    ICT供应链网络关键节点识别属性提取方法

    公开(公告)号:CN112101414A

    公开(公告)日:2020-12-18

    申请号:CN202010811145.5

    申请日:2020-08-13

    IPC分类号: G06K9/62 G06Q10/06 G06Q50/30

    摘要: 本发明涉及ICT供应链网络关键节点的识别和关键节点识别属性提取方法,属于计算机与信息科学技术领域。本发明首先结合ICT供应链的拓扑信息、商业信息进行关键节点识别;然后使用boruta算法分析待选属性的重要性,提取出影响关键节点的重要属性;再使用待选属性构建逻辑回归模型,得到对关键节点有显著影响属性;对于两种方法筛选得到关键属性,采用交集归类的方法进行属性融合,得到最终的关键属性。本发明使用两个不同方法对影响关键节点的属性进行选择,算法之间差异明显,避免单一方法带来的局限性,提高关键属性的泛化性。

    融合日志溯源图实体语义信息的APT检测方法

    公开(公告)号:CN117640230A

    公开(公告)日:2024-03-01

    申请号:CN202311672634.7

    申请日:2023-12-07

    摘要: 本发明涉及融合日志溯源图实体语义信息的APT检测方法。本发明首先使用BERT嵌入日志实体语义信息,并结合日志数据以时间顺序生成日志溯源图子图序列;然后使用改进的图嵌入算法,结合子图结构和日志实体语义信息得到子图向量,通过补充语义信息扩大良性与恶意样本在特征空间中的表征距离;最后优化攻击节点定位方法,依据历史时间段的子图向量序列得到当前时间段的预测子图向量,计算其与实际子图向量的欧式距离,大于阈值便排序节点差异得到可疑节点,并排查得到攻击节点。本发明针对现有方法未考虑日志实体语义信息、需人工排查的可疑节点范围过大的问题,提出融合日志溯源图实体语义信息的APT检测方法,提升APT检测准确率并减少人工排查工作量。

    利用进程行为模式和置信关联度的APT溯源方法

    公开(公告)号:CN117473492A

    公开(公告)日:2024-01-30

    申请号:CN202311662018.3

    申请日:2023-12-06

    IPC分类号: G06F21/55 G06F18/23

    摘要: 本发明涉及利用进程行为模式和置信关联度的APT溯源方法,属于计算机与信息科学技术领域。本发明首先将审计日志文件构建为有向依赖子图和进程图,合并行为模式相同的进程以提高依赖子图约简率;然后计算事件置信度分数和关联度分数,分析事件内部可靠程度,衡量事件与告警事件之间的相关程度,排除良性事件并突出关联度高的攻击事件;最后计算事件异常分数,判断告警子图并还原攻击场景图。本发明针对现有方法约简率低、因事件关联导致告警信息扩散至良性事件从而影响攻击事件精确定位的问题,提出利用进程行为模式和置信关联度的APT溯源方法,缩小依赖图规模,深度挖掘事件隐藏信息,有效降低攻击事件缺失率和良性事件误报率,还原攻击场景图。

    关联拓扑网络动态特征的互联网自治域类型映射方法

    公开(公告)号:CN116208503A

    公开(公告)日:2023-06-02

    申请号:CN202310126432.6

    申请日:2023-02-16

    IPC分类号: H04L41/12 H04L41/16

    摘要: 本发明涉及关联拓扑网络动态特征的互联网自治域类型映射方法,属于计算机与信息科学领域。本发明首先通过whois数据库获取自治域注册信息;其次利用BERT提取注册信息语义特征,同时根据注册信息中的特定自治域属性计算不同自治域间的相似度;然后结合特定自治域属性和自治域间的相似度生成自治域拓扑网络,并利用时间注意力机制提取拓扑网络动态特征;最后融合语义特征和拓扑网络动态特征进行互联网自治域类型映射。本发明针对自治域注册信息不完整的问题,提出并利用一种自治域拓扑网络动态特征提取方法,提高了互联网自治域类型映射的准确率。

    结合训练集数据分布和W距离的模型窃取检测方法

    公开(公告)号:CN115935179A

    公开(公告)日:2023-04-07

    申请号:CN202211346069.0

    申请日:2022-10-31

    摘要: 本发明涉及结合训练集数据分布和W距离的模型窃取检测方法,属于计算机与信息科学技术领域。本发明首先利用VAE方法对训练集和查询集降维;其次利用极大似然估计计算查询集概率分布,依概率分布采样得到多组待检测样本;随后,对每组待检测样本,在训练集中随机采样得到相同数量的参考样本,计算每组待检测样本与参考样本间的W距离;最后,使用参考样本中类别数和总类别数的比值为权值,加权计算所有的W距离,当加权计算结果大于检测阈值时判定检测出为模型窃取。本发明提出关联训练集数据分布的模型窃取检测方法,同时考虑查询集和训练集样本分布特点,改进W距离计算方法,有效提升模型窃取检测的准确率。