-
公开(公告)号:CN108664562B
公开(公告)日:2019-10-01
申请号:CN201810315024.4
申请日:2018-04-10
申请人: 华东师范大学 , 国网浙江省电力有限公司 , 浙江华云信息科技有限公司
摘要: 本发明公开了一种基于粒子群优化的文本特征选择方法,该方法是为了解决采用空间向量模型表示文本出现文本特征向量高维且稀疏的问题,本发明将局部搜索策略嵌入到粒子群优化算法中选择出不相关和显著的特征子集,通过考虑粒子群的相关信息来指导粒子群算法在搜索过程中选择不同的特征,从而从原始特征中选择出更加有利于分类准确率的特征。本发明能够从庞大文本词集中选择出最有利于文本表示的特征子集,从而能为文本的分类、文本处理打下良好的基础。
-
公开(公告)号:CN110084424A
公开(公告)日:2019-08-02
申请号:CN201910338745.1
申请日:2019-04-25
申请人: 国网浙江省电力有限公司 , 浙江华云信息科技有限公司
发明人: 钱仲文 , 黄建平 , 张旭东 , 夏洪涛 , 王文 , 杨少杰 , 王政 , 陈浩 , 张建松 , 沈思琪 , 正卓凡 , 毛宾一 , 吴敏彦 , 王亿 , 陈显辉 , 黄杰 , 王炎 , 陈耀军 , 沈峰 , 陈骏 , 石佳
摘要: 本发明公开了一种基于LSTM与LGBM的电力负荷预测方法,属于电力负荷预测技术领域,包括如下步骤:预处理;构建含有若干层神经单元的LSTM网络,获得LSTM模型预测值;计算LSTM模型的代价函数;构建LGBM决策树,得到LGBM模型预测值;根据LSTM模型的代价函数计算LGBM模型的代价函数;以模型损失函数梯度的负方向为搜索方向,利用梯度下降法,迭代求解目标值,计算平均绝对百分误差MAPE。本发明构建基于LSTM长短期记忆神经网络和LGBM决策树梯度提升方法的电力负荷预测模型,以达到较好的拟合电力数据,充分挖掘出已有数据中的潜在分布信息,准确的完成了考虑天气因素的电力负荷预测任务的目的。
-
公开(公告)号:CN109254871A
公开(公告)日:2019-01-22
申请号:CN201810915167.9
申请日:2018-08-13
申请人: 国网浙江省电力有限公司 , 浙江华云信息科技有限公司 , 国网浙江仙居县供电有限公司
IPC分类号: G06F11/14
摘要: 一种高效的虚拟机数据在线去冗余方法,所述方法为针对虚拟机采用本地存储、全局对比的分布式去冗余,使需要备份的虚拟机数据仅在本地存储一次,通过全局对比,发现该数据块是否已经在其它服务器磁盘上备份,然后通过索引定位其它虚拟机的相同数据块。
-
公开(公告)号:CN113569005B
公开(公告)日:2024-02-20
申请号:CN202110670587.7
申请日:2021-06-17
申请人: 国家电网有限公司 , 国网浙江省电力有限公司
IPC分类号: G06F16/33 , G06F16/35 , G06F16/383 , G06F40/289 , G06F40/30 , G06N3/04 , G06N3/08
摘要: 本发明公开了一种基于数据内容的大规模数据特征智能化提取方法,包括以下步骤:对数据进行字段类型的初步识别,并剔除无效数据;判断数据的中文描述和字段类型,对不匹配的数据进行抽样,计算样本中各字段类型占比,根据占比结果修订字段类型;根据字段类型提取特征。本发明的实质性效果包括:考虑了对表格处理与检测的通用性以及不同字段类型数据所代表的含义之间的联系,只依据表头信息以及数据内容,就可以为各字段提取对应特征,实现数据本身特征提取的自动化与规模化,为数据质量问题排查提供了精准的检测对象识别与定位,为提升后续质量检测工作效率提供了基础。
-
公开(公告)号:CN116231657B
公开(公告)日:2023-09-29
申请号:CN202310511416.9
申请日:2023-05-09
申请人: 国网浙江省电力有限公司 , 清华大学 , 浙江大学
发明人: 黄晓尧 , 吴至复 , 孙宏斌 , 戴铁潮 , 徐昱 , 黄红兵 , 郭庆来 , 黄宇腾 , 杨强 , 张旭东 , 张建松 , 沈思琪 , 葛怀畅 , 王彬 , 潘昭光 , 俞天奇 , 董伟 , 刘艺娴
摘要: 本发明实施例提供一种输配电网全局碳流分布式确定方法及装置,所述方法包括:获取分布式输配电网中的电力属性数据确定全网功率分布;基于全网功率分布,进行潮流追踪,确定对应的基础矩阵及基础向量,构建逆流追踪矩阵;基于基础矩阵、基础向量及逆流追踪矩阵,对发输电主系统进行潮流追踪,计算得到发输电主系统中各节点的电碳因子分布;根据发输电主系统中各节点与配电从系统的连接关系确定边界节点,并将边界节点的电碳因子加入等值的发电机组作为配电从系统的输入,并通过对配电从系统进行潮流追踪,确定配电从系统中各节点的电碳因子分布,从而确定全局碳流分布。采用本方法能够在得到准确的计算结果的同时,也极大的节约了计算资源。
-
公开(公告)号:CN116541572A
公开(公告)日:2023-08-04
申请号:CN202310454061.4
申请日:2023-04-24
申请人: 国网浙江省电力有限公司信息通信分公司
IPC分类号: G06F16/906 , G06F16/907 , G06F16/901 , G06F18/214 , G06F18/21
摘要: 本申请提供了一种模型确定方法及相关装置,该方法包括:获取目标数据库中的多个字段,并确定所多个字段之间的多个关联关系;根据多个字段和多个关联关系,生成目标数据关系网络,目标数据关系网络中包括与多个字段对应的多个节点,以及与多个关联关系对应的多个连接线;基于目标数据关系网络,从多个节点和多个连接线中确定初始关联关系分类模型的训练样本和验证样本;根据训练样本和验证样本对初始关联关系分类模型进行训练和验证,得到关联关系分类模型。通过上述方案,能够用目标数据关系网络对多个字段和多个关联关系进行表示,并能够得到可以自动确定待关联字段之间的关联关系的关联关系分类模型。
-
公开(公告)号:CN116361277A
公开(公告)日:2023-06-30
申请号:CN202310234256.8
申请日:2023-03-08
申请人: 国网浙江省电力有限公司信息通信分公司 , 浙江华云信息科技有限公司
IPC分类号: G06F16/215 , G06F16/242
摘要: 本申请提供一种数据质量检测方法、装置、计算机设备及介质,获取数据中台的目标系统的第一数据,第一数据包括目标字段;对目标字段进行特征标记,得到目标字段对应的目标特征;根据目标特征和预设对应关系,得到目标特征对应的目标质量检测算法;通过PyODPS内置的聚合函数,利用目标质量检测算法对目标字段进行质量检测,得到包括异常数据的检测结果。对多个目标字段进行质量检测时,在数据中台中可以采用多字段并行检测方式,同时,在对多个目标字段中的每一个目标字段进行检测时,PyODPS内置的聚合函数可以调用数据中台内线程级别的多路并发能力,充分利用数据中台的集群资源进行质量检测,提高对数据质量的检测效率。
-
公开(公告)号:CN115016904A
公开(公告)日:2022-09-06
申请号:CN202210276240.9
申请日:2022-03-21
申请人: 国网浙江省电力有限公司信息通信分公司 , 浙江华云信息科技有限公司
IPC分类号: G06F9/48 , G06F16/215 , G06N3/02 , G06N5/00
摘要: 本发明提供了一种数据质量检测任务的调度方法,所述调度方法具体为:首先采集每个检测对象的元数据以及日志数据并进行数据清洗,然后计算特征值并进行预处理,将预处理后的特征值输入算法匹配模型,获取对应的数据检测方法,获取每个检测对象的数据规模、数据维度以及对应的数据检测方法类型,确定每个检测对象的检测任务以及预设的计算资源信息,并通过检测时长预测模型获取对应的检测任务执行时长的预测结果,根据每个检测对象的预测结果生成任务执行队列,进行检测任务分配并开展数据质量检测,直至完成所有的检测任务。本发明能够根据检测任务的检测时长来分配执行顺序,能够控制和压减整体检测任务的时长,保障检测结果的时效性。
-
公开(公告)号:CN108563735B
公开(公告)日:2021-07-27
申请号:CN201810315126.6
申请日:2018-04-10
申请人: 国网浙江省电力有限公司 , 浙江华云信息科技有限公司 , 华东师范大学
IPC分类号: G06F16/33 , G06F16/31 , G06F40/284
摘要: 本发明公开了一种基于词语关联的数据分割搜索方法,该方法采用Apriori算法向下闭合来提取文本的频繁词集,根据活动的支持度选取文本恰当频繁词集合来分割文本,结合文本词向量空间模型来帮助选取分割的文本构建索引的索引关键词词集,完成文本搜索的还原工作。本发明能够达到原始的设计要求,同其它搜索方法相比,搜索更具有准确性,而且用户可以自定义部分算法的变量来调整索引,具有良好的扩展性。
-
公开(公告)号:CN107274050B
公开(公告)日:2021-04-09
申请号:CN201710295845.1
申请日:2017-04-28
申请人: 国网浙江省电力有限公司 , 华北电力大学 , 浙江华云信息科技有限公司
发明人: 成敬周 , 王亿 , 张彩友 , 牛东晓 , 张文军 , 王海潮 , 张旭东 , 齐冷艳 , 施永益 , 王锋华 , 袁雪枫 , 张建松 , 陈浩 , 杨少杰 , 施婧 , 李懑君 , 刘华 , 陈俊
摘要: 本发明提供了基于用户电量拟合的力率电费调整方法,属于电力系统领域,包括:获取用户功率因数,根据用户功率因数与功率因数标准值的对比结果,确定调整系数ξ的表达式,基于调整系数ξ的表达式,对力率电费进行调整,获取调整后电费表达式。通过在现有的功率因数调整电费表的基础上,采用分段拟合的方式确定电费调整系数,进而对力率电费进行调整,最终得到修正后力率电费的表达式,能够表征用户整体无功比例情况,提高了电费计算的精准性。
-
-
-
-
-
-
-
-
-