一种基于差分隐私的分布式隐私保护频繁项集挖掘方法及系统

    公开(公告)号:CN114969804A

    公开(公告)日:2022-08-30

    申请号:CN202210362302.8

    申请日:2022-04-07

    IPC分类号: G06F21/62

    摘要: 本发明公开了一种基于差分隐私的分布式隐私保护频繁项集挖掘方法及系统,所述方法包括:选择中心节点Un+1和参与者节点Ui,设置隐私预算ε及隐私预算分配方案;设定参数;Ui和Un+1生成有序项集支持度集合;Ui采集项集并对支持度添加噪声及后置处理;Un+1构建全局次频繁项集;Ui基于全局次频繁项集进行项集筛选和支持度加噪;Un+1构建全局频繁项集并进行支持度分布拟合更新,继而筛选得出频繁项集挖掘结果,向各个节点Ui发布挖掘结果。本发明针对分布式隐私保护频繁项集挖掘场景,实现了无可信第三方参与的分布式频繁项集挖掘,可以有效阻止恶意挖掘方利用所掌握部分背景知识发起的攻击,提高用户数据隐私的安全性。

    一种保持工作流拓扑特征的隐私保护方法

    公开(公告)号:CN112765661B

    公开(公告)日:2023-09-26

    申请号:CN202110093579.0

    申请日:2021-01-22

    IPC分类号: G06F21/62

    摘要: 一种保持工作流拓扑特征的隐私保护方法,包括以下步骤:对于用户给定的工作流以及隐私保护要求,设计基于拓扑序列的分层模型,提取工作流的拓扑时序特征;构建基于分层模型的工作流最小拓扑子图,设计拓扑度量损失函数;在最小拓扑子图的基础上,进行满足k‑度匿名的图修改操作,匿名过程中依据拓扑度量损失函数,有条件的挑选拓扑损失较低的匿名操作,构建k‑度匿名工作流。本发明通过在k‑度匿名过程中最大程度减少原始工作流的拓扑特征损失实现匿名前后工作流在维持拓扑可用性方面效果相似,实现有效兼顾工作流拓扑可用性和结构隐私安全性的隐私保护工作流匿名发布方法。

    一种基于差分隐私的隐私保护聚类方法

    公开(公告)号:CN113704787A

    公开(公告)日:2021-11-26

    申请号:CN202111006314.9

    申请日:2021-08-30

    IPC分类号: G06F21/60 G06F21/64 G06K9/62

    摘要: 一种基于差分隐私的隐私保护聚类方法,包括:(1)数据所有者计算原数据集中各数据点间的欧氏距离,构建距离矩阵;(2)向距离矩阵添加差分噪声,形成加噪距离矩阵,并将其共享给不可信数据挖掘方,避免聚类分析过程泄露数据隐私;(3)数据挖掘方在加噪距离矩阵中选取k个有良好全局分布性的非离群点,作为聚类的初始中心点;(4)计算每个数据点的最近q个中心点序列,并将数据点分配到距其最近的q个中心点的期望区间内,形成本轮聚簇划分;(5)将每个聚簇内部点间距离和最小的数据点选为新的中心点。重复这一过程,直到各聚簇中心点不再改变。本发明所提方法在实现敏感数据差分隐私保护的同时,可以有效提升聚类挖掘精度。