-
公开(公告)号:CN118586393A
公开(公告)日:2024-09-03
申请号:CN202410735856.7
申请日:2024-06-07
申请人: 国网江苏省电力有限公司信息通信分公司 , 国网江苏省电力有限公司 , 南京理工大学
IPC分类号: G06F40/295 , G06N3/0475 , G06N3/094 , G06N3/047 , G06N3/0442 , G06N3/045 , G06N3/0455 , G06F16/35 , G06F21/62
摘要: 本发明公开了一种敏感数据识别方法、装置、设备、介质及产品。该方法包括:获取待识别文本;将所述待识别文本输入目标模型,得到所述待识别文本对应的向量序列,其中,所述目标模型包括生成器和判别器,所述目标模型通过目标样本集迭代训练所述生成器和所述判别器得到,所述目标样本集包括:输入序列样本和所述输入序列样本对应的预设屏蔽序列;根据所述向量序列确定敏感数据。通过本发明的技术方案,能够通过生成器和判别器来预训练模型,可以帮助模型更好地适应微调阶段的输入,从而提高模型的鲁棒性和泛化能力,准确实现基于命名实体识别的敏感数据识别。