一种数据动态脱敏方法
摘要:
本发明涉及数据脱敏领域,尤其涉及一种数据动态脱敏方法,本发明通过将用户端上传至在线论坛的若干评论文本划分为若干评论文本段,由各所述评论文本段中随机抽取预定比例的关键词组合,确定各关键词组合的显性语义匹配度,划分评论文本段的语义隐藏倾向,后续依据评论文本段的语义隐藏倾向适应性采用不同的脱敏策略对评论文本段进行脱敏,在面对海量数据需脱敏时,节约算力,针对于强语义倾向段的评论文本段,识别特异性关键词组合并进行隐藏重组,基于所得的转换后评论文本段的语义匹配度识别特异性关键词组合中是否存在敏感关键词,通过上述过程,考虑敏感关键词被隐藏替换的情况,提高敏感关键词被隐藏替换下的脱敏效率和准确性。
公开/授权文献
0/0