- 专利标题: 一种结构化数据的敏感属性识别与分类分级方法
-
申请号: CN201910669519.1申请日: 2019-07-24
-
公开(公告)号: CN110377605B公开(公告)日: 2023-04-25
- 发明人: 彭长根 , 何文竹 , 王毛妮 , 丁兴 , 樊玫玫 , 丁红发
- 申请人: 贵州大学
- 申请人地址: 贵州省贵阳市花溪区贵州大学北校区科学技术处
- 专利权人: 贵州大学
- 当前专利权人: 贵州大学
- 当前专利权人地址: 贵州省贵阳市花溪区贵州大学北校区科学技术处
- 代理机构: 贵阳中新专利商标事务所
- 代理商 李亮; 程新敏
- 主分类号: G06F16/22
- IPC分类号: G06F16/22 ; G06F16/28 ; G06F16/2458
摘要:
本发明公开了一种一种结构化数据的敏感属性识别与分类分级方法。本发明将结构化数据表中的敏感属性实现自动化识别及精确地分类分级处理,以便后续将敏感属性的分类分级结果输出采取适当的隐私保护处理后进行数据发布。聚类分析是机器学习中的一种无监督学习方式,不需要预知样本集的分类情况就可以根据属性间相似度自动实现数据属性的分类。在敏感属性的最终识别阶段,考虑了敏感属性与疑似敏感属性之间的关联关系,目的是为了解决链接攻击的问题,从而进一步挖掘与敏感属性有关联的属性,减少隐私的泄露程度。在敏感属性的分类分级阶段,既考虑了敏感属性间的互信息相关性,也分析了属性间的关联关系,两者结合从而对敏感属性更加精准地分类。
公开/授权文献
- CN110377605A 一种结构化数据的敏感属性识别与分类分级方法 公开/授权日:2019-10-25