- 专利标题: 一种文本内容的处理方法、计算机设备及存储介质
-
申请号: CN202010897035.5申请日: 2020-08-31
-
公开(公告)号: CN112052676A公开(公告)日: 2020-12-08
- 发明人: 郭芳 , 于云成 , 王炳功 , 於雪松 , 于志鹏 , 姜乃榕 , 刘子正 , 秦冲 , 张巍 , 王晓燕 , 沙鑫 , 车晨 , 滕建港 , 张英 , 张玉苗 , 张雪玮 , 滕瑶琪 , 陈林 , 邹承志
- 申请人: 国网山东省电力公司荣成市供电公司
- 申请人地址: 山东省威海市荣成市成山大道东段18号
- 专利权人: 国网山东省电力公司荣成市供电公司
- 当前专利权人: 国网山东省电力公司荣成市供电公司
- 当前专利权人地址: 山东省威海市荣成市成山大道东段18号
- 代理机构: 北京锺维联合知识产权代理有限公司
- 代理商 黄利萍; 原春香
- 主分类号: G06F40/289
- IPC分类号: G06F40/289 ; G06F40/226 ; G06F16/903
摘要:
本发明公开了一种文本内容的处理方法、计算机设备及存储介质,所述方法包括:获取目标文本的大小参数;根据所述目标文本的大小参数,对所述目标文件进行分词处理得到目标字符串集合,所述目标字符串集合包括多个目标字符串;当确定所述目标字符串存在预设字符时,发出提示信息;本发明能够根据电子文件中的文件大小,对电子文件中的字符串进行不同的分词处理方法,对分词后形成的目标字符串集合采取对应的方法确定弱敏感词,避免因弱敏感词的遗漏影响到电子文件的应用,提高了弱敏感词的查询速率。
公开/授权文献
- CN112052676B 一种文本内容的处理方法、计算机设备及存储介质 公开/授权日:2021-09-07