发明公开
- 专利标题: 一种面向项目密评的敏感数据识别方法及系统
-
申请号: CN202211526836.6申请日: 2022-11-30
-
公开(公告)号: CN115994381A公开(公告)日: 2023-04-21
- 发明人: 李国强 , 罗隽 , 李琳 , 吴小华 , 刘磊 , 孙雪丰
- 申请人: 武汉深捷科技股份有限公司
- 申请人地址: 湖北省武汉市江岸区花桥街江大路30号
- 专利权人: 武汉深捷科技股份有限公司
- 当前专利权人: 武汉深捷科技股份有限公司
- 当前专利权人地址: 湖北省武汉市江岸区花桥街江大路30号
- 代理机构: 武汉红观专利代理事务所
- 代理商 管先翠
- 主分类号: G06F21/62
- IPC分类号: G06F21/62 ; G06N3/082 ; G06N3/084 ; G06N20/20 ; G06N3/045
摘要:
本发明公开一种面向项目密评的敏感数据识别方法及系统,所述方法包括:采集各类项目的主内容及其元数据并进行预处理,得到数据集D,对数据集D进行标注与格式化;对数据集D中的各个类型的项目分别构建敏感数据深度识别子模型,计算各个模型在对应类型项目数据下的初始梯度;基于联邦学习模型计算各个子模型的聚合梯度均值并共享给各个子模型,更新各个子模型的参数;根据联邦学习模型的损失函数判断是否停止训练或进入下一轮训练,直到联邦学习模型训练结束;待识别的项目数据及其元数据输入联邦学习模型,识别项目中的敏感数据。本发明将自适应梯度剪枝与联邦学习结合,可实现通用领域中多种类型的敏感数据识别,提高敏感数据识别的泛化能力。