基于数据血缘关系图谱的电力数据溯源方法及系统

    公开(公告)号:CN114491081A

    公开(公告)日:2022-05-13

    申请号:CN202210228627.7

    申请日:2022-03-10

    摘要: 本发明涉及一种基于数据血缘关系图谱的电力数据溯源方法及系统,首先采用有序分层法对所有字段进行词汇提取获得字段特征词汇总表;其次利用字段特征词汇总表统计待统计字段中的所有字段信息,同时进行归一化处理获得不同字段数据类型对应的字段特征向量;建立各个字段特征向量之间的血缘关系;然后根据各个字段特征向量之间的血缘关系构建字段级数据血缘图谱和表级数据血缘图谱;最后对已确定血缘方向性的表级数据血缘图谱和/或字段级数据血缘图谱中的每个结点进行溯源分析。本发明将抽象的数据血缘分析问题转换为操作性强的特征空间向量相似性度量问题进行求解,解决数据源字段复杂、数据维度高及维度不固定的问题,实现快速的数据溯源分析。