-
公开(公告)号:CN119150340A
公开(公告)日:2024-12-17
申请号:CN202410818751.8
申请日:2024-06-24
Applicant: 上海观安信息技术股份有限公司
Abstract: 本申请公开了一种基于自然语言处理的敏感数据标注方法、装置及存储介质。涉及数据安全技术领域,其中方法包括:获取待标注的敏感数据,以及所述敏感数据在数据库中的属性信息;利用至少两个标签分类模型分别对所述敏感数据进行标签分类,得到所述至少两个标签分类模型对应的标签分类结果;根据所述标签分类结果,统计所述敏感数据属于目标标签的标签数量;根据所述属性信息和所述目标标签的标签数量,评估所述标签分类结果的准确度;若所述标签分类结果的准确度达到预设标准,则根据所述目标标签的标签数量,确定所述敏感数据对应的打标标签,并对所述敏感数据进行标注。本申请能够提高敏感数据的标注精度。
-
公开(公告)号:CN118709223A
公开(公告)日:2024-09-27
申请号:CN202410818753.7
申请日:2024-06-24
Applicant: 上海观安信息技术股份有限公司
IPC: G06F21/62 , G06F18/24 , G06N3/0464 , G06F18/214 , G06N3/045
Abstract: 本申请公开了一种基于多模型的敏感数据标注方法、装置及存储介质。涉及数据安全技术领域,其中方法包括:获取待标注的敏感数据;利用至少两个标签分类模型对所述敏感数据进行标签分类,得到所述至少两个标签分类模型分别对应的标签分类结果;基于所述至少两个标签分类模型分别对应的标签分类结果,确定所述敏感数据对应的第一标签;同时根据所述至少两个标签分类模型各自的全连接层输出的特征向量,确定所述敏感数据对应的第二标签;基于所述第一标签和所述第二标签,对所述敏感数据进行标注。本申请能够提高敏感数据的标注精度。
-