一种基于多哈希函数的表关系自动关联方法

    公开(公告)号:CN112256698B

    公开(公告)日:2023-09-05

    申请号:CN202011109507.2

    申请日:2020-10-16

    IPC分类号: G06F16/22 G06F16/28

    摘要: 本发明公开了一种基于多哈希函数的表关系自动关联方法,包括以下步骤:步骤一、获取现有的源端数据库,并根据源端数据库的连接配置,获取待发现关联关系的所有数据表;步骤二,对每一张数据表,首先获取数据表的主键,然后针对主键数据初始化一个二进制对象,并利用构造的哈希函数将源端数据库的原始数据进行映射,计算后的二进制向量与该主键序列一一对应;步骤三,根据主外键之间的引用规则,基于主键的二进制向量,对可能与主键发生关联关系的字段进行核查,核查通过则记录本条关系。解决现有数据库表中关联关系不全、数据质量不高、人工核查费时费力等问题。

    一种基于隐私计算的税电联合分析方法

    公开(公告)号:CN114039767A

    公开(公告)日:2022-02-11

    申请号:CN202111306889.2

    申请日:2021-11-05

    摘要: 本发明公开了一种基于隐私计算的税电联合分析方法,包括:数据加密:根据双方商定的协议内容选择相应的加密方式,并生成密钥对;数据对齐:通过加密后的数据ID进行匹配获得匹配结果;联合分析业务计算:根据双方商议好的协议内容进行密文上的联合分析计算,并得出结果;数据解密:通过使用密钥对对联合分析结果进行解密;联合分析结果展示:通过使用其他数据可视化工具进行数据可视化展示。本发明实用性与泛化性强,通过变换不同的业务规则可以实现多维度下隐私计算,在保证了双方的数据安全情况下,实现了联合数据分析,解决业务需求。

    一种疫情影响下售电量精准预测方法

    公开(公告)号:CN111859286A

    公开(公告)日:2020-10-30

    申请号:CN202010536579.9

    申请日:2020-06-12

    IPC分类号: G06F17/18 G06Q30/02 G06Q50/06

    摘要: 本发明公开了一种疫情影响下售电量精准预测方法,包括:构造算法一,由自回归模型拟合售电量曲线,并利用LightGBM集成学习算法预测售电量;构造算法二,利用X13季节分解算法分解售电量曲线处理,以得到预测后的售电量曲线;对算法一的结果以及算法二的结果进行优化估计,得到正常情况下模型最优预测结果。构造算法三,利用均值法得到疫情持续期间的每天影响电量;构造算法四,利用Logistic生长曲线分别预测疫情病例人数和疫情影响时长,并利用综合评价熵权法计算得到每天疫情影响权重;利用算法三和算法四的结果,加权计算每天的疫情影响电量,进而计算整个疫情影响期间的影响电量总量。利用疫情影响的电量计算结果进行修正,得到最终的售电量精准预测结果。

    一种基于设备拓扑与机器学习的多源网架台账融合方法

    公开(公告)号:CN113947500A

    公开(公告)日:2022-01-18

    申请号:CN202111201407.7

    申请日:2021-10-15

    摘要: 本发明公开了一种基于设备拓扑与机器学习的多源网架台账融合方法,包括以下步骤:S101:接入各单系统的网架台账数据,所述网架台账数据包括但不限于实体及实体之间的关系;S102:将接入的各单系统网架台账数据按照所属组织机构进行分类;S103:对每一类实体,筛选出实体在各个系统中的共有属性;S104:根据步骤S103中共有属性值类型的不同,选择不同的相似度计算方法,计算最终的相似度;S105:将最终的相似度与设置的阈值比较,做出判断,两个实体能够融合或不能融合。本发明可以自动地对多系统中的网架台账数据进行自动融合,降低了人工比对的成本,可以有效地提升数据的贯通性,有助于数据管理与价值挖掘。

    一种基于机器学习的综合加权主数据识别方法

    公开(公告)号:CN113920366A

    公开(公告)日:2022-01-11

    申请号:CN202111201242.3

    申请日:2021-10-15

    IPC分类号: G06V10/764 G06N20/00

    摘要: 本发明公开了一种基于机器学习的综合加权主数据识别方法,包括以下步骤:步骤1:梳理业务实体域并依据主数据的特点,选出主数据的最具代表性的特征,所述特征至少包括引用的出度及入度;步骤2:根据步骤1中获得的主数据提取出来的识别特征作为随机森林分类的特征,选取训练集,进行数据清洗,基于随机森林算法,选取最优参数构建决策树;步骤3:使用测试集,利用构建的多棵决策树进行测试,得到对应的分类类别;步骤4:采用综合加权法对决策树赋予不同的权重,采用投票法则得到最终分类结果。本发明可提升企业业务主数据查找的准确率及速率,有效提高企业主数据的管理效率。

    一种用于自来水处理的精准投药方法

    公开(公告)号:CN111859263A

    公开(公告)日:2020-10-30

    申请号:CN202010536580.1

    申请日:2020-06-12

    摘要: 本发明公开了一种用于自来水处理的精准投药方法,包括:数据预处理:0值、空值和异常值处理;通过相关性分析,分析进水指标:进水流量、进水浊度、进水PH、投药量与出水浊度之间的关系;构建日均进水浊度与日均投药量线性回归方程;利用系统动态方程算法构建出水浊度预测模型;利用K-L信息法确定投药出水浊度滞后时间;根据曼哈顿距离算法寻找历史样本中的近似样本,进行投药量近似最优解分析;利用模拟退火算法进行投药量寻优最优解分析。本发明实用性强,实现对自来水生产工艺中精准投药的控制,保证出水水质的情况下,有效避免人工饱和式投药带来的经济损失,意义重大。

    一种用于自来水处理的精准投药方法

    公开(公告)号:CN111859263B

    公开(公告)日:2024-04-12

    申请号:CN202010536580.1

    申请日:2020-06-12

    摘要: 本发明公开了一种用于自来水处理的精准投药方法,包括:数据预处理:0值、空值和异常值处理;通过相关性分析,分析进水指标:进水流量、进水浊度、进水PH、投药量与出水浊度之间的关系;构建日均进水浊度与日均投药量线性回归方程;利用系统动态方程算法构建出水浊度预测模型;利用K‑L信息法确定投药出水浊度滞后时间;根据曼哈顿距离算法寻找历史样本中的近似样本,进行投药量近似最优解分析;利用模拟退火算法进行投药量寻优最优解分析。本发明实用性强,实现对自来水生产工艺中精准投药的控制,保证出水水质的情况下,有效避免人工饱和式投药带来的经济损失,意义重大。

    一种基于目标检测算法的安全帽识别方法

    公开(公告)号:CN114005067A

    公开(公告)日:2022-02-01

    申请号:CN202111306903.9

    申请日:2021-11-05

    摘要: 本发明公开了一种基于目标检测算法的安全帽识别方法,包括:训练阶段得到安全帽识别的预训练模型;推理阶段:所述安全帽识别的预训练模型自动识别出人体目标,即对于每张图片qk(xk),获取若干人体目标Rk:Rk=R(r1、r2、r3、...、ri|qk(xk));并同时对图片的安全帽进行特征提取,识别并定位该图片中佩戴或未佩戴安全帽信息,若识别出未佩戴安全帽情况则告警;模型评估:根据预测结果与实际情况进行对比,评估模型预测效果。本发明实用性强,实现对现场作业人员是否按规定佩戴安全帽的智能检测,有效避免人工监测带来的安全隐患和经济损失,意义重大。