-
公开(公告)号:CN117574122A
公开(公告)日:2024-02-20
申请号:CN202311302420.0
申请日:2023-10-10
Applicant: 中国网络空间研究院
IPC: G06F18/213 , G06F18/214 , G06F18/24 , G06F18/25 , G06F21/62 , G06N3/0464 , G06F40/284 , G06F40/289 , G06F17/16 , G06N3/045 , G06N3/0499 , G06N3/08 , G06N3/0895
Abstract: 本发明属于计算机科学中的机器学习、自然语言处理、隐私计算技术领域,公开了一种面向敏感数据隐私监管跨模态深度学习方法、系统及介质,能够实现对多模态数据中涉及侵犯隐私的违规数据进行识别与分类;对不同模态数据进行特征抽取并统一表示;对统一表示的特征向量进行数据增强;对统一表示的特征向量进行混合匹配处理,获得新的训练特征集;将不同模态的新的训练特征集分别放入相同结构的特征同构分类模型进行模型训练与融合;最后将测试集输入两种模态训练并融合好的模型,输出最终的预测结果,判断是否为隐私数据,若为隐私数据。本发明提供的方法能够将不同模态的信息结合起来,进行隐私数据判断,从而提升隐私信息识别的准确率。
-
公开(公告)号:CN117574121A
公开(公告)日:2024-02-20
申请号:CN202311302310.4
申请日:2023-10-10
Applicant: 中国网络空间研究院
IPC: G06F18/213 , G06F18/241 , G06F18/243 , G06F18/25 , G06F21/62 , G06F18/10 , G06F40/284 , G06F40/289 , G06N5/01 , G06N20/20 , G06N3/045 , G06N3/0464 , G06N3/047 , G06N3/092 , G06F18/2415
Abstract: 本发明属于计算机科学中的隐私计算、人工智能、模式识别与分类技术领域,公开了一种企业多源异构数据敏感信息智能化统一检测方法及系统,可对企业在使用数据过程中涉及的多源异构数据进行判断是否存在违规行为,获取多源异构数据;对多源异构数据按其数据组成形式进行划分,分别为图像/图片、日志/文本、结构化向量数据,并进行相应的预处理;对预处理后的多源异构数据结合隐私监管规则进行特征抽取,形成三类特征子集;对抽取后的三类特征子集分别采用分类器进行分类;最后对三个分类器的分类结果,通过多源异构融合统一识别与分类模块输出最终分类结果。本发明能够充分利用了各模态中的数据信息,提升了分类准确率。
-