Invention Publication
- Patent Title: 一种基于聚类匿名化与差分隐私保护的数据处理方法及系统
- Patent Title (English): Data processing method and system based on clustering anonymization and differential privacy protection
-
Application No.: CN201910251356.5Application Date: 2019-03-29
-
Publication No.: CN110069943APublication Date: 2019-07-30
- Inventor: 许斌 , 梁晓兵 , 翟峰 , 刘鹰 , 吕英杰 , 岑炜 , 付义伦 , 李保丰 , 曹永峰 , 张庚 , 孔令达 , 徐萌 , 冯云 , 王楠 , 袁泉 , 冯占成 , 杨全萍 , 任博 , 周琪 , 卢艳 , 韩文博 , 李丽丽 , 王新刚
- Applicant: 中国电力科学研究院有限公司 , 国家电网有限公司 , 国网上海市电力公司
- Applicant Address: 北京市海淀区清河小营东路15号
- Assignee: 中国电力科学研究院有限公司,国家电网有限公司,国网上海市电力公司
- Current Assignee: 中国电力科学研究院有限公司,国家电网有限公司,国网上海市电力公司
- Current Assignee Address: 北京市海淀区清河小营东路15号
- Agency: 北京工信联合知识产权代理有限公司
- Agent 姜丽辉
- Main IPC: G06F21/62
- IPC: G06F21/62 ; G06K9/62

Abstract:
本发明公开了一种基于聚类匿名化与差分隐私保护的数据处理方法及系统,包括:对原始数据集中的数据进行转换和归一化处理;对经过转换和归一化处理的数据集进行聚类处理,以获取具有属性相互独立的多个数据簇;对多个数据簇进行划分,并计算每个等价组的质心值,用质心值代替相应等价组的数据记录的值,以获取匿名化后的多个等价组;根据差分隐私保护的并行组合性质对删除某条数据记录的等价组添加噪声,获取满足差分隐私的查询集;计算相似度,并在所述相似度大于0时,发布该等价组的满足差分隐私保护的数据集。本发明有效地节省了计算开销和隐私预算,提高了非交互式差分隐私保护高维数据发布查询结果的准确性,确保了发布数据的可用性。
Public/Granted literature
- CN110069943B 一种基于聚类匿名化与差分隐私保护的数据处理方法及系统 Public/Granted day:2021-06-22
Information query