一种基于差分隐私的非等距直方图发布方法

    公开(公告)号:CN110795758A

    公开(公告)日:2020-02-14

    申请号:CN201910961197.8

    申请日:2019-10-11

    Abstract: 本发明提供的一种基于差分隐私的非等距直方图发布方法,涉及数据隐私保护技术领域,包括两个主要步骤:1)针对以往关于在差分隐私下直方图发布方法未考虑到数据分布的稀疏程度而划分的等距直方图不能充分反映样本数据的分布特征,以及可能出现“零桶”等问题,通过平均划分纵坐标来确定横坐标每组分界点的方法生成非等距直方图;2)在非等距直方图上对每个分组按照组距大小合理分配隐私预算,并对每组分别添加服从拉普拉斯分布的随机噪声以提高非等距直方图中数据的隐私性,并保证部分长范围查询的查询结果精度。本发明既合理保证数据的隐私性和可用性,又有效保证了数据的分布特征。

    一种基于差分隐私的非等距直方图发布方法

    公开(公告)号:CN110795758B

    公开(公告)日:2021-07-30

    申请号:CN201910961197.8

    申请日:2019-10-11

    Abstract: 本发明提供的一种基于差分隐私的非等距直方图发布方法,涉及数据隐私保护技术领域,包括两个主要步骤:1)针对以往关于在差分隐私下直方图发布方法未考虑到数据分布的稀疏程度而划分的等距直方图不能充分反映样本数据的分布特征,以及可能出现“零桶”等问题,通过平均划分纵坐标来确定横坐标每组分界点的方法生成非等距直方图;2)在非等距直方图上对每个分组按照组距大小合理分配隐私预算,并对每组分别添加服从拉普拉斯分布的随机噪声以提高非等距直方图中数据的隐私性,并保证部分长范围查询的查询结果精度。本发明既合理保证数据的隐私性和可用性,又有效保证了数据的分布特征。

    基于交互式查询的自适应差分隐私预算分配方法及其系统

    公开(公告)号:CN112487472B

    公开(公告)日:2023-11-17

    申请号:CN202011237987.0

    申请日:2020-11-09

    Abstract: 本发明提供的基于交互式查询的自适应差分隐私预算分配方法及其系统,涉及数据隐私保护技术领域,通过预处理查询数据库减少无关属性的数据量,对该预处理后的查询数据库计算极大频繁项集,根据极大频繁项集查找当前查询属性在历史查询记录中的关联属性;计算当前查询属性和任一关联属性的杰卡德系数,根据杰卡德系数计算当前查询属性查询时能分配的差分隐私保护参数上界;当隐私预算参数阈值分配不够或计算的上界小于设定的每次查询分配的隐私预算参数下界时,通过指数机制从关联属性中选取一关联属性的查询结果作为当前查询的查询结果,即当前查询属性不再分配隐私预算。本发明采用量化关联属性对隐私泄露的程度,合理分配隐私预算。

    基于交互式查询的自适应差分隐私预算分配方法及其系统

    公开(公告)号:CN112487472A

    公开(公告)日:2021-03-12

    申请号:CN202011237987.0

    申请日:2020-11-09

    Abstract: 本发明提供的基于交互式查询的自适应差分隐私预算分配方法及其系统,涉及数据隐私保护技术领域,通过预处理查询数据库减少无关属性的数据量,对该预处理后的查询数据库计算极大频繁项集,根据极大频繁项集查找当前查询属性在历史查询记录中的关联属性;计算当前查询属性和任一关联属性的杰卡德系数,根据杰卡德系数计算当前查询属性查询时能分配的差分隐私保护参数上界;当隐私预算参数阈值分配不够或计算的上界小于设定的每次查询分配的隐私预算参数下界时,通过指数机制从关联属性中选取一关联属性的查询结果作为当前查询的查询结果,即当前查询属性不再分配隐私预算。本发明采用量化关联属性对隐私泄露的程度,合理分配隐私预算。

    基于Spark的高维序列数据相似性查询方法及系统

    公开(公告)号:CN110795469B

    公开(公告)日:2022-02-22

    申请号:CN201910963344.5

    申请日:2019-10-11

    Abstract: 本发明公开了一种基于Spark的高维序列数据相似性查询方法及系统,包括数据预处理、索引构建和查询等处理步骤。本发明使用分布式集群Spark提高计算能力;通过利用局部敏感哈希(LSH)函数来构建索引解决了高维序列数据处理困难等问题;查询过程只在部分Worker节点中进行,大大降低了数据的处理量,并且通过碰撞计数机制,有效的减少了候选集的规模,加速相似性查找的速率。本发明可以对用户任意给出的一条高维序列数据对象,快速且准确的从大规模数据集中查找出大部分相似数据对象。

    基于Spark的高维序列数据相似性查询方法及系统

    公开(公告)号:CN110795469A

    公开(公告)日:2020-02-14

    申请号:CN201910963344.5

    申请日:2019-10-11

    Abstract: 本发明公开了一种基于Spark的高维序列数据相似性查询方法及系统,包括数据预处理、索引构建和查询等处理步骤。本发明使用分布式集群Spark提高计算能力;通过利用局部敏感哈希(LSH)函数来构建索引解决了高维序列数据处理困难等问题;查询过程只在部分Worker节点中进行,大大降低了数据的处理量,并且通过碰撞计数机制,有效的减少了候选集的规模,加速相似性查找的速率。本发明可以对用户任意给出的一条高维序列数据对象,快速且准确的从大规模数据集中查找出大部分相似数据对象。

    一种面向教育领域的实体和关系联合抽取方法

    公开(公告)号:CN112364654B

    公开(公告)日:2024-12-20

    申请号:CN202011252896.4

    申请日:2020-11-11

    Inventor: 秦锋 张志文 郑啸

    Abstract: 本发明公开了一种面向教育领域的实体和关系联合抽取方法,用于解决现有方法缺少在教育领域中的应用,本发明利用预训练的XLNET语言模型获得高层次特征嵌入,并通过Mogrifier BiGRU神经网络捕获文本上下文语义信息,同时在Mogrifier BiGRU神经网络后引入MultiHead Attention机制捕捉文本特征中较为重要的部分,有效解决了实体内部存在大量修饰词干扰的问题;本发明通过联合提取的方式,同时进行实体与关系的抽取,通过参数共享编码层实现实体与关系子任务间的依赖,从而缓解了错误传播的问题。

Patent Agency Ranking