-
公开(公告)号:CN118585677A
公开(公告)日:2024-09-03
申请号:CN202410625819.0
申请日:2024-05-20
Applicant: 国网江苏省电力有限公司信息通信分公司
IPC: G06F16/903 , G06F16/901 , G06F18/213 , G06F18/25 , G06N3/0455 , G06V10/82 , G06V30/19 , G06F18/23213 , G10L25/30 , G10L25/54
Abstract: 本发明属于数据检测技术领域,具体为一种应用于数据库安全的多模态数据检测方法,确定数据库内的数据倾向,并根据数据倾向构建多模态融合分析数据;获取数据库的数据资源文件,基于原始多模态数据进行扩增,得到多模态数据集;对原始多模态数据集进行编码,得到原始数据特征编码;本方案通过多模态数据集对数据库内的数据进行筛分和检测,改变了以往只能从单一文本数据获取特征信息的方法,采用综合OCR文本识别、语音识别和NLP自然语言综合采样的方案,对所有的文本、图像和语言进行综合采集、检测,对重要的涉密信息进行筛选和分类;通过对数据库内信息的检测和筛选,增加了对普通信息的分类能力,增强了数据库的安全性。
-
公开(公告)号:CN116451173A
公开(公告)日:2023-07-18
申请号:CN202310407226.2
申请日:2023-04-17
Applicant: 国网江苏省电力有限公司信息通信分公司
IPC: G06F18/25 , G06F18/243 , G06F18/214 , G06N3/045 , G06N3/0442 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于预训练模型的多模型电力敏感信息识别方法,包括:获取历史电力信息数据集并对其进行敏感信息标注,获得训练集;基于预训练语言模型构建N个神经网络模型,并利用所述训练集对所述N个神经网络模型进行训练,其中N大于等于2;利用训练好的N个神经网络模型对待识别的电力信息数据集进行敏感信息识别,获得N个识别结果;输出最终识别结果:若N个识别结果相同,则直接输出识别结果;若N个识别结果不相同,则基于统计学习的多模型决策方法对所述N个识别结果进行处理,依据处理结果输出最终识别结果。本发明公开的一种基于预训练模型的多模型电力敏感信息识别方法显著提高了电力敏感信息识别模型的泛化能力和准确率。
-
公开(公告)号:CN116363664A
公开(公告)日:2023-06-30
申请号:CN202310374284.X
申请日:2023-04-10
Applicant: 国网江苏省电力有限公司信息通信分公司
Abstract: 本发明公开了一种基于OCR技术的涉密文本检查标注方法及系统,涉及计算机文本图像识别技术领域。其中所述方法包括,获取待识别的视频图像;对提取的视频图像,进行多个不同角度方向上的滤波操作,获取不同角度方向的纹理图像;构建并训练SVM分类网络,利用训练好的SVM分类网络对不同角度方向的纹理图像进行分类,获取每个角度方向纹理图像的文本区域和背景区域;利用cnocr文字识别框架对文本区域中的文本信息进行检测识别;识别出文本信息中的涉密文字并进行标注。通过本发明能够对复杂场景视频图像中的文本目标进行准确识别并针对其涉密特征进行标注。
-
-