一种面向项目密评的敏感数据识别方法及系统
摘要:
本发明公开一种面向项目密评的敏感数据识别方法及系统,所述方法包括:采集各类项目的主内容及其元数据并进行预处理,得到数据集D,对数据集D进行标注与格式化;对数据集D中的各个类型的项目分别构建敏感数据深度识别子模型,计算各个模型在对应类型项目数据下的初始梯度;基于联邦学习模型计算各个子模型的聚合梯度均值并共享给各个子模型,更新各个子模型的参数;根据联邦学习模型的损失函数判断是否停止训练或进入下一轮训练,直到联邦学习模型训练结束;待识别的项目数据及其元数据输入联邦学习模型,识别项目中的敏感数据。本发明将自适应梯度剪枝与联邦学习结合,可实现通用领域中多种类型的敏感数据识别,提高敏感数据识别的泛化能力。
0/0