-
公开(公告)号:CN118861174A
公开(公告)日:2024-10-29
申请号:CN202411320676.9
申请日:2024-09-23
申请人: 国网江苏省电力有限公司信息通信分公司 , 国网江苏省电力有限公司 , 南京理工大学
摘要: 本申请公开了一种基于属性和标签处理数据方法、数据溯源方法及其装置、设备及介质。该方法包括:确定每个属性的权重并根据各属性的权重确定待插入标签的非重要属性;根据非重要属性的数量以及每个非重要属性的权重,将数字标签拆分为相应数量的子标签;将每个子标签插入相应非重要属性的数值的小数部分,得到处理后的目标数据。上述技术方案通过分析不同属性的权重并针对非重要属性插入数字标签,可实现针对多属性进行多点插入,并且通过将数字标签拆分为子标签分别插入至不同的非重要属性的数值的小数部分,可减少插入数字标签对源数据的影响,且能避免由于部分数据转发破坏数字标签的整体性,从而提高数字标签的鲁棒性和数据安全性。
-
公开(公告)号:CN118586393A
公开(公告)日:2024-09-03
申请号:CN202410735856.7
申请日:2024-06-07
申请人: 国网江苏省电力有限公司信息通信分公司 , 国网江苏省电力有限公司 , 南京理工大学
IPC分类号: G06F40/295 , G06N3/0475 , G06N3/094 , G06N3/047 , G06N3/0442 , G06N3/045 , G06N3/0455 , G06F16/35 , G06F21/62
摘要: 本发明公开了一种敏感数据识别方法、装置、设备、介质及产品。该方法包括:获取待识别文本;将所述待识别文本输入目标模型,得到所述待识别文本对应的向量序列,其中,所述目标模型包括生成器和判别器,所述目标模型通过目标样本集迭代训练所述生成器和所述判别器得到,所述目标样本集包括:输入序列样本和所述输入序列样本对应的预设屏蔽序列;根据所述向量序列确定敏感数据。通过本发明的技术方案,能够通过生成器和判别器来预训练模型,可以帮助模型更好地适应微调阶段的输入,从而提高模型的鲁棒性和泛化能力,准确实现基于命名实体识别的敏感数据识别。
-