一种基于贝叶斯网络模型的电费异常诊断方法和系统

    公开(公告)号:CN117633652A

    公开(公告)日:2024-03-01

    申请号:CN202311539021.6

    申请日:2023-11-17

    摘要: 一种基于贝叶斯网络模型的电费异常诊断方法和系统。从营销系统数据库中获取量费计划明细数据、审核异常明细数据和因子库明细数据,按照用户用电类型划分得到量费计划明细数据集、审核异常明细数据集和因子库明细数据集;对量费计划明细数据集进行缺失值和离散化处理,确定业务异常点候选集合,构建用于贝叶斯网络模型的样本数据集,划分训练集与测试集;基于训练集确定初始贝叶斯网络结构和参数,根据业务经验和影响因子权重对贝叶斯网络结构和参数进行优化;基于测试集利用优化后的贝叶斯网络模型识别每个样本数据的异常类型以及影响因子,根据识别结果和业务异常点候选集合确定业务异常点。本发明的方案实现了电费结算异常的智能、精准、快速的研判和溯源。

    一种基于差分隐私的隐私保护聚类方法

    公开(公告)号:CN113704787B

    公开(公告)日:2023-12-29

    申请号:CN202111006314.9

    申请日:2021-08-30

    摘要: 一种基于差分隐私的隐私保护聚类方法,包括:(1)数据所有者计算原数据集中各数据点间的欧氏距离,构建距离矩阵;(2)向距离矩阵添加差分噪声,形成加噪距离矩阵,并将其共享给不可信数据挖掘方,避免聚类分析过程泄露数据隐私;(3)数据挖掘方在加噪距离矩阵中选取k个有良好全局分布性的非离群点,作为聚类的初始中心点;(4)计算每个数据点的最近q个中心点序列,并将数据点分配到距其最近的q个中心点的期望区间内,形成本轮聚簇划分;(5)将每个聚簇内部点间距离和最小的数据点选为新的中心点。重复这一过程,直到各聚簇中心点不再改变。本发明所提方法在实现敏感数据差分隐私保护的同时,可以有效提升聚类挖掘精度。

    一种基于同态加密的分布式隐私保护分类方法及系统

    公开(公告)号:CN115587139A

    公开(公告)日:2023-01-10

    申请号:CN202211372124.3

    申请日:2022-11-03

    IPC分类号: G06F16/26 G06F21/62

    摘要: 本发明提出一种基于同态加密的分布式隐私保护分类方法及系统,定义参与数据挖掘的n个数据参与方,全局数据集D的属性,预测样本;数据挖掘方Pn生成同态加密所需的公钥和私钥,数据参与方Pi计算本地局部数据集中各数据点与预测样本X间的欧氏距离,构建局部距离向量M;并生成一个随机数向量加和到局部距离向量中,生成加密距离子向量,Pi得到加密距离向量M’。并得到全局加密距离向量,Pn根据预测样本X对全局加密距离向量进行排序,选取距离X最近的K数据点。数据挖掘方通过统计这K个数据点的类标号,找到最多的类标号,并作为预测样本的预测类标号。本发明所提方法在实现各方数据隐私保护的同时,可以有效兼顾分类精度。

    一种半自动实体标注监督方法
    5.
    发明公开

    公开(公告)号:CN113988064A

    公开(公告)日:2022-01-28

    申请号:CN202111399124.8

    申请日:2021-11-19

    IPC分类号: G06F40/279 G06K9/62

    摘要: 一种半自动实体标注监督方法及系统,方法包括以下步骤:步骤1,对第一设定数量的小样本进行标注;步骤2,训练标注模型;若标注模型质量满足要求,执行步骤4,若标注模型质量需要提升,执行步骤3;步骤3,迭代执行自动标注、标注质量监督、校对、更新训练集和训练模型,直至迭代次数达到最大迭代次数;若迭代结果标注模型的F1值不小于第一阈值,则执行步骤4;若迭代结果标注模型的F1值仍小于第一阈值,调整标签及标注规范并返回步骤1;步骤4,对剩余未标注的样本进行标注,并对标注进行监督,包括标注模型的质量监督和对标注人员的监督;步骤5,分析人工与标注的标注结果是否一致,如果不一致,整理分析所属类别。