电网监控数据处理方法、装置、设备及存储介质
摘要:
本发明提供了一种电网监控数据处理方法、装置、设备及存储介质,首先获取包括第一结构化数据和非结构化数据;然后将非结构化数据转化为半结构化数据,并根据第一知识图谱确定第一结构化数据和半结构化数据的第一相关系数;接着选取第一相关系数大于第一预设阈值的第一结构化数据,组成第一数据组;再将半结构化数据全部转化为第二结构化数据;最终根据第二结构化数据和第一数据组,确定并去除重复性数据。通过对比半结构化数据的特征信息与第一结构化数据之间的相关性,从而将可能重复的半结构化数据与第一结构化数据关联,最终在半结构化数据化为结构化数据后,对关联的数据进行重复性筛除,从而避免数据重复造成存储资源和处理资源的浪费。
0/0