-
公开(公告)号:CN112163105B
公开(公告)日:2024-02-09
申请号:CN202010671253.7
申请日:2020-07-13
Applicant: 北京国电通网络技术有限公司 , 国家电网有限公司大数据中心
Abstract: 本发明提供一种图像数据的存储方法、装置、电子设备及存储介质。所述方法包括:获取图像样本库中的目标图像;获取所述目标图像的指纹数据;计算所述目标图像与所述图像样本库中所有图像的相似度,得到相似度数据;设置所述目标图像的标签数据;将所述指纹数据、所述相似度数据和所述标签数据连接为所述目标图像的结构化数据,并存储至所述图像样本库中。本发明实施例存储简单高效,内存占用与计算复杂度低,降低后续图像处理时长,提高后续图像处理效率。
-
公开(公告)号:CN115774745A
公开(公告)日:2023-03-10
申请号:CN202111043514.1
申请日:2021-09-07
Applicant: 国家电网有限公司大数据中心
Abstract: 本发明提供一种针对大容量Excel文件数据的抽取方法及系统,包括:获取待抽取的Excel文件及对应的磁盘地址;分别根据所述待抽取的Excel文件以及对应的磁盘地址构建Excel实体对象及数据库中用于存储读取到的Excel数据的数据表;利用EasyExcel逐条读取Excel实体对象中的数据并记录至内存,将内存中的数据通过基于MySQL JDBC的持久化函数持久化至数据库中,得到抽取后的Excel文件数据;其中,所述Excel实体对象包括Excel文件中需要抽取的数据。本发明利用EasyExcel和基于MySQL JDBC的持久化方法降低了大容量Excel文件数据写入数据库时占用的内存,提高了数据读取的效率及写入数据库的速度。
-
公开(公告)号:CN114020919A
公开(公告)日:2022-02-08
申请号:CN202111395009.3
申请日:2021-11-23
Applicant: 国家电网有限公司大数据中心
IPC: G06F16/35 , G06F16/2452 , G06F16/242
Abstract: 本发明公开了一种数据处理方法、装置、设备和存储介质。该方法包括:对预先构建的训练样本集中的所有训练样本进行无监督自动聚类,得到至少两个类别的训练样本子集;基于预先创建的错误样本修正模型,自动对每个所述训练样本子集中的所有错误样本进行在线修正标注,得到对应的修正样本。本实施例通过对预先创建的训练样本集中的所有训练样本进行无监督自动聚类,得到至少两个类别的训练样本子集,并基于预先创建的错误样本修正模型,自动对每个训练样本子集中的所有错误样本进行在线修正和标注,得到对应的修正样本,实现了在线自动修正和标注错误样本的效果,从而提高了错误样本的修正效率。
-
公开(公告)号:CN113495900A
公开(公告)日:2021-10-12
申请号:CN202110933193.6
申请日:2021-08-12
Applicant: 国家电网有限公司大数据中心
IPC: G06F16/2452 , G06F40/284
Abstract: 本发明实施例公开了基于自然语言的结构化查询语言语句获取方法、装置、电子设备及存储介质,该方法包括:获取自然语言下的查询文本,并确定查询文本的查询类别;获取查询文本中的命名实体,并确定命名实体的实体类别;根据查询文本的查询类别,以及命名实体的实体类别,对槽位信息模板中的槽位信息项进行填充,以获取第一填充结果;根据第一填充结果,以及结构化查询语言查询模板,获取结构化查询语言查询语句。本发明实施例提供的技术方案,实现了基于自然语言构建SQL查询语句,提升了用户对SQL数据库的访问便利性,提高了SQL查询语句的转换精度。
-
公开(公告)号:CN112560586A
公开(公告)日:2021-03-26
申请号:CN202011360719.8
申请日:2020-11-27
Applicant: 国家电网有限公司大数据中心 , 北京国电通网络技术有限公司
Abstract: 本说明书一个或多个实施例提供一种杆塔标识牌结构化数据获得方法、装置及电子设备,所述获得方法包括获取原始图像;将所述原始图像输入预训练好的目标检测模型中,获得杆塔标识牌图像、所述杆塔标识牌图像中的标识信息以及所述杆塔标识牌图像中的内容边线;根据所述标识信息之间的位置关系,获得所述杆塔标识牌图像的类别;根据所述内容边线,计算所述杆塔标识牌图像的几何变换精度;输出所述杆塔标识牌的所述标识信息、类别以及几何变换精度。本发明实施例通过预先训练好的目标检测方法,能够对标识牌同时进行定位与识别,简化了识别步骤,有效的提高了标识牌结构化数据的识别效率。
-
公开(公告)号:CN119621724A
公开(公告)日:2025-03-14
申请号:CN202411724929.9
申请日:2024-11-28
Applicant: 国家电网有限公司大数据中心
Abstract: 本发明公开了一种数据管理方法、系统、设备及存储介质。通过展示数据管理系统中的数据操作界面,数据操作页面中包括至少一个数据操作项,数据操作项中包括数据共享操作项;响应于对数据申请控件的触发,展示数据申请编辑表单,数据申请控件包含在数据共享操作项对应的操作页面中;响应于对数据申请编辑表单中提交控件的触发,生成数据申请请求,并通过数据共享通道将数据申请请求提交至数据中台,以使数据中台开通数据申请请求所对应数据内容的访问权限。该方法通过调用数据中台授权应用程序编程接口对所述数据申请请求进行自动授权,提高了数据共享的效率,满足了大规模数据授权的需要,同时提升了管理申请数据的水平,并且降低了管理成本。
-
公开(公告)号:CN119476265A
公开(公告)日:2025-02-18
申请号:CN202411593240.7
申请日:2024-11-08
Applicant: 国家电网有限公司大数据中心
IPC: G06F40/232 , G06F16/33 , G06F16/35 , G06N3/044 , G06N3/08
Abstract: 本发明公开了一种模型训练方法、电网数据纠错方法、装置、设备及存储介质。该方法包括:利用电网设备本体质量数据生成标注有纠错标签的纠错训练样本,并将所述标注有纠错标签的纠错训练样本输入初始模型,以得到所述初始模型输出的纠错信息;利用所述纠错信息和所述纠错标签,确定每个纠错类型的纠错标签的预测熵,并利用所述预测熵确定所述初始模型的损失值;根据所述损失值确定所述初始模型的训练轮数,以得到纠错模型,其中,所述纠错模型用于对输入的电网设备本体质量数据进行纠错。本发明实施例的技术方案,纠错模型训练过程高效、准确和简单,且得到的纠错模型具有良好的可扩展性,可应用于电网的各个子领域的数据纠错场景中。
-
公开(公告)号:CN112560586B
公开(公告)日:2024-05-10
申请号:CN202011360719.8
申请日:2020-11-27
Applicant: 国家电网有限公司大数据中心 , 北京国电通网络技术有限公司
IPC: G06V20/13 , G06V20/10 , G06V10/774 , G06V10/82 , G06V10/44 , G06V10/764 , G06N3/0464 , G06T5/80 , G06T7/13 , G06T7/70
Abstract: 本说明书一个或多个实施例提供一种杆塔标识牌结构化数据获得方法、装置及电子设备,所述获得方法包括获取原始图像;将所述原始图像输入预训练好的目标检测模型中,获得杆塔标识牌图像、所述杆塔标识牌图像中的标识信息以及所述杆塔标识牌图像中的内容边线;根据所述标识信息之间的位置关系,获得所述杆塔标识牌图像的类别;根据所述内容边线,计算所述杆塔标识牌图像的几何变换精度;输出所述杆塔标识牌的所述标识信息、类别以及几何变换精度。本发明实施例通过预先训练好的目标检测方法,能够对标识牌同时进行定位与识别,简化了识别步骤,有效的提高了标识牌结构化数据的识别效率。
-
公开(公告)号:CN114020773A
公开(公告)日:2022-02-08
申请号:CN202111387375.4
申请日:2021-11-22
Applicant: 国家电网有限公司大数据中心
IPC: G06F16/242 , G06F16/2452
Abstract: 本发明实施例公开了一种基于内外网数据交换的数据查询方法、装置、设备及介质。包括:接收用户通过外网输入的自然语言查询语句;基于所述自然语言查询语句从内网数据库获取查询结果。通过外网输入的自然语言查询语句从内网获取查询结果,可以提高内外网数据交换下数据查询的效率。
-
公开(公告)号:CN112307227A
公开(公告)日:2021-02-02
申请号:CN202011326744.4
申请日:2020-11-24
Applicant: 国家电网有限公司大数据中心
Abstract: 本发明公开了一种数据分类方法,包括:获取待分类的原始媒体数据,对原始媒体数据进行预处理得到各时刻的节点特征矩阵;根据各节点特征矩阵,计算各时刻的第一目标权重值;根据各节点特征矩阵以及第一目标权重值,计算各时刻的媒体特征向量,根据各时刻的媒体特征向量,对原始媒体数据进行分类。本发明实施例的技术方案可以减少对数据分类的耗时,提高数据的分类效率。
-
-
-
-
-
-
-
-
-