-
公开(公告)号:CN112052676A
公开(公告)日:2020-12-08
申请号:CN202010897035.5
申请日:2020-08-31
申请人: 国网山东省电力公司荣成市供电公司
发明人: 郭芳 , 于云成 , 王炳功 , 於雪松 , 于志鹏 , 姜乃榕 , 刘子正 , 秦冲 , 张巍 , 王晓燕 , 沙鑫 , 车晨 , 滕建港 , 张英 , 张玉苗 , 张雪玮 , 滕瑶琪 , 陈林 , 邹承志
IPC分类号: G06F40/289 , G06F40/226 , G06F16/903
摘要: 本发明公开了一种文本内容的处理方法、计算机设备及存储介质,所述方法包括:获取目标文本的大小参数;根据所述目标文本的大小参数,对所述目标文件进行分词处理得到目标字符串集合,所述目标字符串集合包括多个目标字符串;当确定所述目标字符串存在预设字符时,发出提示信息;本发明能够根据电子文件中的文件大小,对电子文件中的字符串进行不同的分词处理方法,对分词后形成的目标字符串集合采取对应的方法确定弱敏感词,避免因弱敏感词的遗漏影响到电子文件的应用,提高了弱敏感词的查询速率。
-
公开(公告)号:CN112052676B
公开(公告)日:2021-09-07
申请号:CN202010897035.5
申请日:2020-08-31
申请人: 国网山东省电力公司荣成市供电公司
发明人: 郭芳 , 于云成 , 王炳功 , 於雪松 , 于志鹏 , 姜乃榕 , 刘子正 , 秦冲 , 张巍 , 王晓燕 , 沙鑫 , 车晨 , 滕建港 , 张英 , 张玉苗 , 张雪玮 , 滕瑶琪 , 陈林 , 邹承志
IPC分类号: G06F40/289 , G06F40/226 , G06F16/903
摘要: 本发明公开了一种文本内容的处理方法、计算机设备及存储介质,所述方法包括:获取目标文本的大小参数;根据所述目标文本的大小参数,对所述目标文件进行分词处理得到目标字符串集合,所述目标字符串集合包括多个目标字符串;当确定所述目标字符串存在预设字符时,发出提示信息;本发明能够根据电子文件中的文件大小,对电子文件中的字符串进行不同的分词处理方法,对分词后形成的目标字符串集合采取对应的方法确定弱敏感词,避免因弱敏感词的遗漏影响到电子文件的应用,提高了弱敏感词的查询速率。
-