一种基于聚类匿名化与差分隐私保护的数据处理方法及系统
Abstract:
本发明公开了一种基于聚类匿名化与差分隐私保护的数据处理方法及系统,包括:对原始数据集中的数据进行转换和归一化处理;对经过转换和归一化处理的数据集进行聚类处理,以获取具有属性相互独立的多个数据簇;对多个数据簇进行划分,并计算每个等价组的质心值,用质心值代替相应等价组的数据记录的值,以获取匿名化后的多个等价组;根据差分隐私保护的并行组合性质对删除某条数据记录的等价组添加噪声,获取满足差分隐私的查询集;计算相似度,并在所述相似度大于0时,发布该等价组的满足差分隐私保护的数据集。本发明有效地节省了计算开销和隐私预算,提高了非交互式差分隐私保护高维数据发布查询结果的准确性,确保了发布数据的可用性。
Patent Agency Ranking
0/0