-
公开(公告)号:CN109858674A
公开(公告)日:2019-06-07
申请号:CN201811612619.2
申请日:2018-12-27
Applicant: 国网浙江省电力有限公司 , 国网浙江省电力公司杭州供电公司 , 浙江华云信息科技有限公司
Abstract: 本发明提供了基于XGBoost算法的月度负荷预测方法,包括对负荷指标进行转换,对影响负荷因素指标数据进行热编码处理;以用户每月最大负荷数据作为模型的输出,选择与月最大负荷关联性较强的影响因素变量作为输入变量;将选入模型的影响负荷预测因素变量转化为稀疏矩阵,形成XGboost建模数据;将月最大负荷定义为XGboost模型输出;定义模型学习目标函数、回归树生成参数等构造负荷预测的XGboost模型;对XGboost各参数进行交叉验证测试,得到模型精度最高的参数组合,基于得到的参数组合进行负荷预测。经验证,模型结果显示平均相对误差控制在5%,模型对于预测单个企业未来一个月的最大负荷数据有较好的效果,对帮助企业优化用电方式,降低用电成本有一定的指导和借鉴意义。
-
公开(公告)号:CN113591485A
公开(公告)日:2021-11-02
申请号:CN202110671379.9
申请日:2021-06-17
Applicant: 国网浙江省电力有限公司 , 国网浙江省电力有限公司信息通信分公司 , 浙江华云信息科技有限公司
IPC: G06F40/30 , G06F40/289 , G06F40/242 , G06K9/46 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于数据科学的智能化数据质量稽核系统及方法,方法包括:数据采集:进行检测对象元数据采集以及日志数据采集解析;数据特征提取:识别并剔除无效表和无效字段,同时通过修订算法根据数据内容对字段类型进行自动修订,根据字段类型提取特征;异常检测:预设数据异常检测方法库,与数据特征进行匹配以选取对应的异常检测方法并检测;任务调度编排:设置编排服务器和节点服务器,编排服务器根据任务请求将上述任务拆分为若干子步后分发给不同节点服务器处理。本发明提降低了数据资产管理和数据质量治理的门槛,实现数据质量稽核的通用性、规模化、自动化以及智能化,整体提升数据质量稽核的效率与工作质量。
-
公开(公告)号:CN113591485B
公开(公告)日:2024-07-12
申请号:CN202110671379.9
申请日:2021-06-17
Applicant: 国网浙江省电力有限公司 , 国网浙江省电力有限公司信息通信分公司 , 浙江华云信息科技有限公司
IPC: G06F40/30 , G06F40/289 , G06F40/242 , G06V10/42 , G06V10/75 , G06V10/762 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于数据科学的智能化数据质量稽核系统及方法,方法包括:数据采集:进行检测对象元数据采集以及日志数据采集解析;数据特征提取:识别并剔除无效表和无效字段,同时通过修订算法根据数据内容对字段类型进行自动修订,根据字段类型提取特征;异常检测:预设数据异常检测方法库,与数据特征进行匹配以选取对应的异常检测方法并检测;任务调度编排:设置编排服务器和节点服务器,编排服务器根据任务请求将上述任务拆分为若干子步后分发给不同节点服务器处理。本发明提降低了数据资产管理和数据质量治理的门槛,实现数据质量稽核的通用性、规模化、自动化以及智能化,整体提升数据质量稽核的效率与工作质量。
-
公开(公告)号:CN116361277A
公开(公告)日:2023-06-30
申请号:CN202310234256.8
申请日:2023-03-08
Applicant: 国网浙江省电力有限公司信息通信分公司 , 浙江华云信息科技有限公司
IPC: G06F16/215 , G06F16/242
Abstract: 本申请提供一种数据质量检测方法、装置、计算机设备及介质,获取数据中台的目标系统的第一数据,第一数据包括目标字段;对目标字段进行特征标记,得到目标字段对应的目标特征;根据目标特征和预设对应关系,得到目标特征对应的目标质量检测算法;通过PyODPS内置的聚合函数,利用目标质量检测算法对目标字段进行质量检测,得到包括异常数据的检测结果。对多个目标字段进行质量检测时,在数据中台中可以采用多字段并行检测方式,同时,在对多个目标字段中的每一个目标字段进行检测时,PyODPS内置的聚合函数可以调用数据中台内线程级别的多路并发能力,充分利用数据中台的集群资源进行质量检测,提高对数据质量的检测效率。
-
公开(公告)号:CN115016904A
公开(公告)日:2022-09-06
申请号:CN202210276240.9
申请日:2022-03-21
Applicant: 国网浙江省电力有限公司信息通信分公司 , 浙江华云信息科技有限公司
IPC: G06F9/48 , G06F16/215 , G06N3/02 , G06N5/00
Abstract: 本发明提供了一种数据质量检测任务的调度方法,所述调度方法具体为:首先采集每个检测对象的元数据以及日志数据并进行数据清洗,然后计算特征值并进行预处理,将预处理后的特征值输入算法匹配模型,获取对应的数据检测方法,获取每个检测对象的数据规模、数据维度以及对应的数据检测方法类型,确定每个检测对象的检测任务以及预设的计算资源信息,并通过检测时长预测模型获取对应的检测任务执行时长的预测结果,根据每个检测对象的预测结果生成任务执行队列,进行检测任务分配并开展数据质量检测,直至完成所有的检测任务。本发明能够根据检测任务的检测时长来分配执行顺序,能够控制和压减整体检测任务的时长,保障检测结果的时效性。
-
公开(公告)号:CN108563735B
公开(公告)日:2021-07-27
申请号:CN201810315126.6
申请日:2018-04-10
Applicant: 国网浙江省电力有限公司 , 浙江华云信息科技有限公司 , 华东师范大学
IPC: G06F16/33 , G06F16/31 , G06F40/284
Abstract: 本发明公开了一种基于词语关联的数据分割搜索方法,该方法采用Apriori算法向下闭合来提取文本的频繁词集,根据活动的支持度选取文本恰当频繁词集合来分割文本,结合文本词向量空间模型来帮助选取分割的文本构建索引的索引关键词词集,完成文本搜索的还原工作。本发明能够达到原始的设计要求,同其它搜索方法相比,搜索更具有准确性,而且用户可以自定义部分算法的变量来调整索引,具有良好的扩展性。
-
公开(公告)号:CN107274050B
公开(公告)日:2021-04-09
申请号:CN201710295845.1
申请日:2017-04-28
Applicant: 国网浙江省电力有限公司 , 华北电力大学 , 浙江华云信息科技有限公司
Inventor: 成敬周 , 王亿 , 张彩友 , 牛东晓 , 张文军 , 王海潮 , 张旭东 , 齐冷艳 , 施永益 , 王锋华 , 袁雪枫 , 张建松 , 陈浩 , 杨少杰 , 施婧 , 李懑君 , 刘华 , 陈俊
Abstract: 本发明提供了基于用户电量拟合的力率电费调整方法,属于电力系统领域,包括:获取用户功率因数,根据用户功率因数与功率因数标准值的对比结果,确定调整系数ξ的表达式,基于调整系数ξ的表达式,对力率电费进行调整,获取调整后电费表达式。通过在现有的功率因数调整电费表的基础上,采用分段拟合的方式确定电费调整系数,进而对力率电费进行调整,最终得到修正后力率电费的表达式,能够表征用户整体无功比例情况,提高了电费计算的精准性。
-
公开(公告)号:CN107147129B
公开(公告)日:2020-06-23
申请号:CN201710294542.8
申请日:2017-04-28
Applicant: 国网浙江省电力有限公司 , 华北电力大学 , 浙江华云信息科技有限公司
Inventor: 张文军 , 戴波 , 牛东晓 , 王亿 , 秦俊宁 , 王海潮 , 王政 , 张旭东 , 何鹤 , 施永益 , 王锋华 , 成敬周 , 张霞 , 颜虹 , 范华 , 周雷 , 陈浩 , 刘华 , 张建松 , 王坚敏
IPC: H02J3/18
Abstract: 本发明提供了基于变压器损耗的无功补偿用户筛选方法,属于电力系统领域,包括:获取连接在变压器上的用户编号,以及与每个用户编号对应的用电参数;根据用电参数确定进行无功补偿的临界值;如果用电参数中的样本用电参数高于临界值,则获取样本用电参数对应的样本用户编号,样本用户编号对应的用户即为需要进行无功补偿的用户。通过确定需要进行无功补偿的临界值,进而将用户的用电参数与临界值进行对比,从而确定需要进行无功补偿的用户。相对于现有技术,能够根据用户实际用电情况选择合适的计费方式,降低用户的用电支出。
-
公开(公告)号:CN107292486B
公开(公告)日:2021-01-26
申请号:CN201710305601.7
申请日:2017-05-03
Applicant: 国网浙江省电力有限公司 , 华北电力大学 , 浙江华云信息科技有限公司
Inventor: 张建松 , 牛东晓 , 施婧 , 秦俊宁 , 夏慧聪 , 陈铁义 , 施永益 , 王锋华 , 成敬周 , 王梦 , 李懑君 , 田晶 , 陈凯洋 , 冯海俊 , 张霞 , 颜虹 , 宋国超 , 陈刚
Abstract: 本发明公开了一种电网资产保险支出测算模型,利用广义帕累托分布对电网资产在严重灾害下可能产生的损失进行预测,并对可能发生严重损失的频数进行概率统计,测算电网资产由于严重灾害可能产生的损失总额。基于测算的损失额度,合理确定电网资产的保险支出。本发明提出的方法为测算电网企业的合理保险支出提供了依据,帮助企业合理调配资金,从而保证电网企业的经济运行。
-
公开(公告)号:CN108664562B
公开(公告)日:2019-10-01
申请号:CN201810315024.4
申请日:2018-04-10
Applicant: 华东师范大学 , 国网浙江省电力有限公司 , 浙江华云信息科技有限公司
Abstract: 本发明公开了一种基于粒子群优化的文本特征选择方法,该方法是为了解决采用空间向量模型表示文本出现文本特征向量高维且稀疏的问题,本发明将局部搜索策略嵌入到粒子群优化算法中选择出不相关和显著的特征子集,通过考虑粒子群的相关信息来指导粒子群算法在搜索过程中选择不同的特征,从而从原始特征中选择出更加有利于分类准确率的特征。本发明能够从庞大文本词集中选择出最有利于文本表示的特征子集,从而能为文本的分类、文本处理打下良好的基础。
-
-
-
-
-
-
-
-
-