一种数据分类方法、装置和存储介质

    公开(公告)号:CN113868497A

    公开(公告)日:2021-12-31

    申请号:CN202111140419.3

    申请日:2021-09-28

    Abstract: 本申请涉及网络信息安全技术领域,尤其涉及一种数据分类方法、装置和存储介质,用以提高敏感数据分类准确率,包括:获取待检测数据信息;将待检测数据信息与预设敏感信息库中的各个敏感信息标签分别进行匹配,获得与待检测数据信息匹配的第一分类标签,基于已训练的分类模型,对待检测数据信息进行敏感信息分类,获得对应的第二分类标签;若第一分类标签和第二分类标签不一致,且第二分类标签的置信度不大于预设阈值,将第一分类标签作为待检测数据信息对应的目标分类标签;若第二分类标签的置信度大于预设阈值,将第二分类标签作为对应的目标分类标签。本申请通过将基于敏感信息库与神经网络匹配到的结果融合,提高了对敏感数据的安全防护能力。

    一种密码算法识别方法及相关装置

    公开(公告)号:CN115048638A

    公开(公告)日:2022-09-13

    申请号:CN202210730742.4

    申请日:2022-06-24

    Abstract: 本申请公开了一种密码算法识别方法及相关装置,涉及信息安全技术领域。本申请中,获取基于待识别密码算法加密的密文数据,再基于密文数据的序列特征,获得密文数据的随机特征向量,其中,随机特征向量表征:待识别密码算法的加解密方式,从而分别基于预设的特征向量集合中各候选特征向量,各自与随机特征向量之间的向量相似度,筛选出满足预设的相似度条件的目标特征向量,并最终将目标特征向量对应的候选密码算法作为待识别密码算法。采用这种方式,避免了现有技术中,因传统机器学习通常基于单一或者较少的统计特征,对密码算法进行识别,从而导致对密码算法的识别不准确的技术弊端,提高了密码算法的识别准确率。

    一种表数据泛化方法及装置

    公开(公告)号:CN114548303B

    公开(公告)日:2025-04-18

    申请号:CN202210184206.9

    申请日:2022-02-25

    Abstract: 本申请公开了一种表数据泛化方法及装置,用以提升表数据泛化的效率。该方法包括:确定待泛化的表中多个表数据分别包括的各类型的子数据,其中子数据的类型包括数值型、包含语义的第一文本型以及不包含语义的第二文本型;根据任一表数据包括的各类型的子数据的距离参数,确定其与各中心点的距离;其中数值型子数据与各中心点的数值型变量的相似程度为其距离参数;第一文本型子数据与各中心点的第一文本型变量的相似程度为其距离参数;第二文本型子数据的距离参数指示其与各中心点的第二文本型变量是否相同;根据各表数据与各中心点的距离,将多个表数据划分为至少一个类别簇;采用设定的数据泛化算法对至少一个类别簇分别进行泛化处理。

    一种表数据泛化方法及装置

    公开(公告)号:CN114548303A

    公开(公告)日:2022-05-27

    申请号:CN202210184206.9

    申请日:2022-02-25

    Abstract: 本申请公开了一种表数据泛化方法及装置,用以提升表数据泛化的效率。该方法包括:确定待泛化的表中多个表数据分别包括的各类型的子数据,其中子数据的类型包括数值型、包含语义的第一文本型以及不包含语义的第二文本型;根据任一表数据包括的各类型的子数据的距离参数,确定其与各中心点的距离;其中数值型子数据与各中心点的数值型变量的相似程度为其距离参数;第一文本型子数据与各中心点的第一文本型变量的相似程度为其距离参数;第二文本型子数据的距离参数指示其与各中心点的第二文本型变量是否相同;根据各表数据与各中心点的距离,将多个表数据划分为至少一个类别簇;采用设定的数据泛化算法对至少一个类别簇分别进行泛化处理。

Patent Agency Ranking