电力数据处理方法、装置、电子设备及存储介质

    公开(公告)号:CN115017256A

    公开(公告)日:2022-09-06

    申请号:CN202210413091.6

    申请日:2022-04-19

    摘要: 本发明涉及电力系统领域,具体涉及一种电力数据处理方法、装置、电子设备及存储介质。包括:获取电力数据对应的元数据;元数据用于描述电力数据;提取元数据中的目标字段信息;对目标字段信息进行识别,确定电力数据对应的类别。上述电力数据处理方法,获取电力数据对应的元数据,而不是电力数据的明细数据,从而可以减少获取到的数据的数据量。此外,由于元数据用于描述电力数据,因此通过对电力数据的元数据中的目标字段信息进行识别,可以清楚确定电力数据的类型。因此,不仅保证了确定的电力数据的类型的准确性,并且提高了对电力数据进行处理的效率。

    基于实体消歧的数据库中的关键数据元素识别方法及系统

    公开(公告)号:CN113505590A

    公开(公告)日:2021-10-15

    申请号:CN202110839335.2

    申请日:2021-07-23

    IPC分类号: G06F40/279 G06F40/30

    摘要: 本发明公开了一种基于实体消歧的数据库中的关键数据元素识别方法及系统,其包括:结合DeepType模型、DeepMatch模型以及DeepCosine模型对数据库中的数据进行实体类型的预测以及实体的消歧,其中,所述数据库中包括多个数据表;基于Apriori算法以及FP‑growth算法对消歧后的数据库中的数据进行关联分析从而构建数据库表关联图;基于所述数据库表关联图识别出关键数据元素;基于候选实体类型、上下文的关联信息以及候选实体向量对所述关键数据元素进行解析和消歧。本发明的基于实体消歧的数据库中的关键数据元素识别方法及系统,其实现了全电网一张数据库视图,便于及时获取电网中的关键数据元素,可以提高电网行业数据管理效率。

    一种基于数据特征的大规模数据质量异常检测方法

    公开(公告)号:CN113569006A

    公开(公告)日:2021-10-29

    申请号:CN202110671429.3

    申请日:2021-06-17

    IPC分类号: G06F16/33 G06F40/242

    摘要: 本发明公开了一种基于数据特征的大规模数据质量异常检测方法,包括以下步骤:构建数据异常检测方法库,根据每种数据特征设置对应的检测方法,汇总形成数据异常检测方法库;对数据特征进行异常检测方法匹配,根据匹配结果中的异常检测方法进行检测;大规模数据特征遍历,对每个数据特征进行匹配和检测。本发明的实质性效果包括:将异常检测由检测规则驱动的方式转变为由数据特征驱动的方式,基于各字段中数据本身的特征信息生成相应的异常值检测方法,同时针对大规模数据设置特殊的模糊化处理机制,实现数据质量检核的规模化与自动化,提高数据质量问题检测效率。