-
公开(公告)号:CN113591485B
公开(公告)日:2024-07-12
申请号:CN202110671379.9
申请日:2021-06-17
Applicant: 国网浙江省电力有限公司 , 国网浙江省电力有限公司信息通信分公司 , 浙江华云信息科技有限公司
IPC: G06F40/30 , G06F40/289 , G06F40/242 , G06V10/42 , G06V10/75 , G06V10/762 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于数据科学的智能化数据质量稽核系统及方法,方法包括:数据采集:进行检测对象元数据采集以及日志数据采集解析;数据特征提取:识别并剔除无效表和无效字段,同时通过修订算法根据数据内容对字段类型进行自动修订,根据字段类型提取特征;异常检测:预设数据异常检测方法库,与数据特征进行匹配以选取对应的异常检测方法并检测;任务调度编排:设置编排服务器和节点服务器,编排服务器根据任务请求将上述任务拆分为若干子步后分发给不同节点服务器处理。本发明提降低了数据资产管理和数据质量治理的门槛,实现数据质量稽核的通用性、规模化、自动化以及智能化,整体提升数据质量稽核的效率与工作质量。
-
公开(公告)号:CN116361277A
公开(公告)日:2023-06-30
申请号:CN202310234256.8
申请日:2023-03-08
Applicant: 国网浙江省电力有限公司信息通信分公司 , 浙江华云信息科技有限公司
IPC: G06F16/215 , G06F16/242
Abstract: 本申请提供一种数据质量检测方法、装置、计算机设备及介质,获取数据中台的目标系统的第一数据,第一数据包括目标字段;对目标字段进行特征标记,得到目标字段对应的目标特征;根据目标特征和预设对应关系,得到目标特征对应的目标质量检测算法;通过PyODPS内置的聚合函数,利用目标质量检测算法对目标字段进行质量检测,得到包括异常数据的检测结果。对多个目标字段进行质量检测时,在数据中台中可以采用多字段并行检测方式,同时,在对多个目标字段中的每一个目标字段进行检测时,PyODPS内置的聚合函数可以调用数据中台内线程级别的多路并发能力,充分利用数据中台的集群资源进行质量检测,提高对数据质量的检测效率。
-
公开(公告)号:CN115016904A
公开(公告)日:2022-09-06
申请号:CN202210276240.9
申请日:2022-03-21
Applicant: 国网浙江省电力有限公司信息通信分公司 , 浙江华云信息科技有限公司
IPC: G06F9/48 , G06F16/215 , G06N3/02 , G06N5/00
Abstract: 本发明提供了一种数据质量检测任务的调度方法,所述调度方法具体为:首先采集每个检测对象的元数据以及日志数据并进行数据清洗,然后计算特征值并进行预处理,将预处理后的特征值输入算法匹配模型,获取对应的数据检测方法,获取每个检测对象的数据规模、数据维度以及对应的数据检测方法类型,确定每个检测对象的检测任务以及预设的计算资源信息,并通过检测时长预测模型获取对应的检测任务执行时长的预测结果,根据每个检测对象的预测结果生成任务执行队列,进行检测任务分配并开展数据质量检测,直至完成所有的检测任务。本发明能够根据检测任务的检测时长来分配执行顺序,能够控制和压减整体检测任务的时长,保障检测结果的时效性。
-
公开(公告)号:CN113157903A
公开(公告)日:2021-07-23
申请号:CN202011585288.5
申请日:2020-12-28
Applicant: 国网浙江省电力有限公司信息通信分公司 , 浙江华云信息科技有限公司
IPC: G06F16/335 , G06F16/31 , G06F40/216 , G06F40/284 , G06F40/295
Abstract: 本发明公开了一种面向多领域的电力词库构建方法,解决了现有技术的不足,包括以下步骤:步骤1,收集电力相关文档,对电力相关文档的文字信息进行提取,在文字信息中枚举出所有文本片段,文本片段的长度小于设定阈值;步骤2,根据词法相关统计指标对文本片段进行过滤,过滤后的文本片段为候选新词,所有候选新词构成候选词库;步骤3,候选词库中的候选新词与常用词汇进行比较,若候选新词是常用词汇,则将该候选新词舍弃,若候选新词不是常用词汇,则将该候选新词定义为正式新词;步骤4,所有的正式新词构成专业词库。
-
公开(公告)号:CN111461400B
公开(公告)日:2023-06-23
申请号:CN202010128406.3
申请日:2020-02-28
Applicant: 国网浙江省电力有限公司 , 浙江华云信息科技有限公司 , 国网浙江省电力有限公司信息通信分公司
IPC: G06Q10/04 , G06Q50/06 , G06F18/23213 , G06F18/15 , G06F17/18 , G06N3/0442 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种基于Kmeans和T‑LSTM的负荷数据补全方法,涉及一种数据补全方法。目前数据补全方法,数据偏差大,往往达不到预期效果。本发明包括以下步骤:构建数据模型;K种负荷区间的数据分别训练得到对应的K种数据模型;定时取待补全数据的当天负荷数据;计算当天负荷数据的平均值;根据平均值获取对应的数据模型;将待补全负荷数据输入对应的数据模型中,计算得到补全的完整负荷数据。本技术方案能够很好的把相似特征的负荷数据归为一类,排出不同特征数据的干扰;更能准确的反映缺失数据的真实负荷值。通过本方法实现准确补全数据,其具有误差小、收敛速度快的优点。
-
公开(公告)号:CN113591485A
公开(公告)日:2021-11-02
申请号:CN202110671379.9
申请日:2021-06-17
Applicant: 国网浙江省电力有限公司 , 国网浙江省电力有限公司信息通信分公司 , 浙江华云信息科技有限公司
IPC: G06F40/30 , G06F40/289 , G06F40/242 , G06K9/46 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于数据科学的智能化数据质量稽核系统及方法,方法包括:数据采集:进行检测对象元数据采集以及日志数据采集解析;数据特征提取:识别并剔除无效表和无效字段,同时通过修订算法根据数据内容对字段类型进行自动修订,根据字段类型提取特征;异常检测:预设数据异常检测方法库,与数据特征进行匹配以选取对应的异常检测方法并检测;任务调度编排:设置编排服务器和节点服务器,编排服务器根据任务请求将上述任务拆分为若干子步后分发给不同节点服务器处理。本发明提降低了数据资产管理和数据质量治理的门槛,实现数据质量稽核的通用性、规模化、自动化以及智能化,整体提升数据质量稽核的效率与工作质量。
-
公开(公告)号:CN111461400A
公开(公告)日:2020-07-28
申请号:CN202010128406.3
申请日:2020-02-28
Applicant: 国网浙江省电力有限公司 , 浙江华云信息科技有限公司 , 国网浙江省电力有限公司信息通信分公司
Abstract: 本发明公开了一种基于Kmeans和T-LSTM的负荷数据补全方法,涉及一种数据补全方法。目前数据补全方法,数据偏差大,往往达不到预期效果。本发明包括以下步骤:构建数据模型;K种负荷区间的数据分别训练得到对应的K种数据模型;定时取待补全数据的当天负荷数据;计算当天负荷数据的平均值;根据平均值获取对应的数据模型;将待补全负荷数据输入对应的数据模型中,计算得到补全的完整负荷数据。本技术方案能够很好的把相似特征的负荷数据归为一类,排出不同特征数据的干扰;更能准确的反映缺失数据的真实负荷值。通过本方法实现准确补全数据,其具有误差小、收敛速度快的优点。
-
公开(公告)号:CN111461399A
公开(公告)日:2020-07-28
申请号:CN202010128368.1
申请日:2020-02-28
Applicant: 国网浙江省电力有限公司 , 浙江华云信息科技有限公司 , 国网浙江省电力有限公司信息通信分公司
Abstract: 本发明公开了一种基于故障非线性离散分布的驻点坐标配置方法,涉及一种驻点坐标配置方法。目前抢修驻点固点,影响抢修效率。本发明包括以下步骤:获取历史数据,根据配网资源和维护人员数量,明确抢修驻点数量,枚举抢修驻点数量K;使用K-means算法,利用历史工单抢修点的坐标信息,对抢修点进行聚类,得到相应的待定抢修驻点坐标;对聚类得到的待定抢修驻点坐标进行核验,计算在该待定抢修驻点策略下的平均抢修时长;取最小平均抢修时长的抢修驻点策略为最终驻点优化结果。本技术方案采用移动的驻点坐标信息,实现了配网指挥抢修驻点地理位置的科学、合理布局,减少抢修队伍到达故障现场时长,提升配网故障抢修工单处理工作效率,降低停电故障时间。
-
公开(公告)号:CN112104660A
公开(公告)日:2020-12-18
申请号:CN202010986839.2
申请日:2020-09-18
Applicant: 国网浙江省电力有限公司 , 国网浙江省电力有限公司信息通信分公司 , 浙江华云信息科技有限公司
Abstract: 本申请公开了一种数据传输方法、相关设备及可读存储介质。基于上述方案,发送方可以发送包括头字节字段、请求序号字段、操作码字段、对象标识字段、消息体长度字段、消息体字段和校验码字段的二进制格式数据报文,接收方可以对二进制格式数据报文进行解析。由于二进制格式数据报文相对于JSON,XML等格式,占用的传输资源较小,而边缘网关和云平台可以互为发送方和接收方,因此,边缘网关和云平台之间传输的数据为二进制格式数据报文时,能够提升边缘网关和云平台之间的数据传输的效率和可靠性。
-
公开(公告)号:CN110852556A
公开(公告)日:2020-02-28
申请号:CN201910894565.1
申请日:2019-09-20
Applicant: 国网浙江省电力有限公司 , 国网浙江省电力有限公司信息通信分公司 , 浙江华云信息科技有限公司
IPC: G06Q10/06 , G06Q50/06 , G06F40/186 , G06F40/205
Abstract: 本发明公开了95598抢修工单自动派单方法,涉及一种派单方法。现行的95598抢修工单派单,采用人工派单的形式,工单需要经人工层层下达才能最终到达抢修班组。这种人工派单的方式不仅消耗大量人力,同时也造成了一定的抢修延时。本发明包括步骤:根据历史工单数据,生成五层树状地址知识库;利用蒙特卡洛方法分析历史工单数据,得到每级地址对应的抢修班组;当收到抢修工单后,利用生成的树状知识库对抢修工单中的地址文本进行解析,并基于解析出来的地址,结合抢修班组对应信息,得到抢修工单地址对应的抢修班组信息,实现抢修工单的自动派单。本技术方案实现抢修工单的自动派单,减少人工成本,提高派单效率,有效提升用户体验。
-
-
-
-
-
-
-
-
-