-
公开(公告)号:CN108664562B
公开(公告)日:2019-10-01
申请号:CN201810315024.4
申请日:2018-04-10
申请人: 华东师范大学 , 国网浙江省电力有限公司 , 浙江华云信息科技有限公司
摘要: 本发明公开了一种基于粒子群优化的文本特征选择方法,该方法是为了解决采用空间向量模型表示文本出现文本特征向量高维且稀疏的问题,本发明将局部搜索策略嵌入到粒子群优化算法中选择出不相关和显著的特征子集,通过考虑粒子群的相关信息来指导粒子群算法在搜索过程中选择不同的特征,从而从原始特征中选择出更加有利于分类准确率的特征。本发明能够从庞大文本词集中选择出最有利于文本表示的特征子集,从而能为文本的分类、文本处理打下良好的基础。
-
公开(公告)号:CN110084424A
公开(公告)日:2019-08-02
申请号:CN201910338745.1
申请日:2019-04-25
申请人: 国网浙江省电力有限公司 , 浙江华云信息科技有限公司
发明人: 钱仲文 , 黄建平 , 张旭东 , 夏洪涛 , 王文 , 杨少杰 , 王政 , 陈浩 , 张建松 , 沈思琪 , 正卓凡 , 毛宾一 , 吴敏彦 , 王亿 , 陈显辉 , 黄杰 , 王炎 , 陈耀军 , 沈峰 , 陈骏 , 石佳
摘要: 本发明公开了一种基于LSTM与LGBM的电力负荷预测方法,属于电力负荷预测技术领域,包括如下步骤:预处理;构建含有若干层神经单元的LSTM网络,获得LSTM模型预测值;计算LSTM模型的代价函数;构建LGBM决策树,得到LGBM模型预测值;根据LSTM模型的代价函数计算LGBM模型的代价函数;以模型损失函数梯度的负方向为搜索方向,利用梯度下降法,迭代求解目标值,计算平均绝对百分误差MAPE。本发明构建基于LSTM长短期记忆神经网络和LGBM决策树梯度提升方法的电力负荷预测模型,以达到较好的拟合电力数据,充分挖掘出已有数据中的潜在分布信息,准确的完成了考虑天气因素的电力负荷预测任务的目的。
-
公开(公告)号:CN109254871A
公开(公告)日:2019-01-22
申请号:CN201810915167.9
申请日:2018-08-13
申请人: 国网浙江省电力有限公司 , 浙江华云信息科技有限公司 , 国网浙江仙居县供电有限公司
IPC分类号: G06F11/14
摘要: 一种高效的虚拟机数据在线去冗余方法,所述方法为针对虚拟机采用本地存储、全局对比的分布式去冗余,使需要备份的虚拟机数据仅在本地存储一次,通过全局对比,发现该数据块是否已经在其它服务器磁盘上备份,然后通过索引定位其它虚拟机的相同数据块。
-
公开(公告)号:CN116361277A
公开(公告)日:2023-06-30
申请号:CN202310234256.8
申请日:2023-03-08
申请人: 国网浙江省电力有限公司信息通信分公司 , 浙江华云信息科技有限公司
IPC分类号: G06F16/215 , G06F16/242
摘要: 本申请提供一种数据质量检测方法、装置、计算机设备及介质,获取数据中台的目标系统的第一数据,第一数据包括目标字段;对目标字段进行特征标记,得到目标字段对应的目标特征;根据目标特征和预设对应关系,得到目标特征对应的目标质量检测算法;通过PyODPS内置的聚合函数,利用目标质量检测算法对目标字段进行质量检测,得到包括异常数据的检测结果。对多个目标字段进行质量检测时,在数据中台中可以采用多字段并行检测方式,同时,在对多个目标字段中的每一个目标字段进行检测时,PyODPS内置的聚合函数可以调用数据中台内线程级别的多路并发能力,充分利用数据中台的集群资源进行质量检测,提高对数据质量的检测效率。
-
公开(公告)号:CN115016904A
公开(公告)日:2022-09-06
申请号:CN202210276240.9
申请日:2022-03-21
申请人: 国网浙江省电力有限公司信息通信分公司 , 浙江华云信息科技有限公司
IPC分类号: G06F9/48 , G06F16/215 , G06N3/02 , G06N5/00
摘要: 本发明提供了一种数据质量检测任务的调度方法,所述调度方法具体为:首先采集每个检测对象的元数据以及日志数据并进行数据清洗,然后计算特征值并进行预处理,将预处理后的特征值输入算法匹配模型,获取对应的数据检测方法,获取每个检测对象的数据规模、数据维度以及对应的数据检测方法类型,确定每个检测对象的检测任务以及预设的计算资源信息,并通过检测时长预测模型获取对应的检测任务执行时长的预测结果,根据每个检测对象的预测结果生成任务执行队列,进行检测任务分配并开展数据质量检测,直至完成所有的检测任务。本发明能够根据检测任务的检测时长来分配执行顺序,能够控制和压减整体检测任务的时长,保障检测结果的时效性。
-
公开(公告)号:CN108563735B
公开(公告)日:2021-07-27
申请号:CN201810315126.6
申请日:2018-04-10
申请人: 国网浙江省电力有限公司 , 浙江华云信息科技有限公司 , 华东师范大学
IPC分类号: G06F16/33 , G06F16/31 , G06F40/284
摘要: 本发明公开了一种基于词语关联的数据分割搜索方法,该方法采用Apriori算法向下闭合来提取文本的频繁词集,根据活动的支持度选取文本恰当频繁词集合来分割文本,结合文本词向量空间模型来帮助选取分割的文本构建索引的索引关键词词集,完成文本搜索的还原工作。本发明能够达到原始的设计要求,同其它搜索方法相比,搜索更具有准确性,而且用户可以自定义部分算法的变量来调整索引,具有良好的扩展性。
-
公开(公告)号:CN109388733B
公开(公告)日:2022-01-07
申请号:CN201810916036.2
申请日:2018-08-13
申请人: 国网浙江省电力有限公司 , 浙江华云信息科技有限公司 , 国网浙江仙居县供电有限公司
IPC分类号: G06F16/901 , G06F9/448
摘要: 本发明提出一种新的图数据处理引擎优化方法,其特征在于,采用本地迭代,全局通信的处理方式,所述处理方式首先在同一计算节点上开展计算,直到该计算节点上的所有图节点的数据都完成更新则停止局部迭代;在同一计算节点上开展计算的同时,边缘图节点缓存并合并消息,待局部迭代停止后批量传输计算节点间发送的消息,所述边缘图节点为跨两个或多个计算节点的图节点。
-
公开(公告)号:CN113591485B
公开(公告)日:2024-07-12
申请号:CN202110671379.9
申请日:2021-06-17
申请人: 国网浙江省电力有限公司 , 国网浙江省电力有限公司信息通信分公司 , 浙江华云信息科技有限公司
IPC分类号: G06F40/30 , G06F40/289 , G06F40/242 , G06V10/42 , G06V10/75 , G06V10/762 , G06N3/04 , G06N3/08
摘要: 本发明公开了一种基于数据科学的智能化数据质量稽核系统及方法,方法包括:数据采集:进行检测对象元数据采集以及日志数据采集解析;数据特征提取:识别并剔除无效表和无效字段,同时通过修订算法根据数据内容对字段类型进行自动修订,根据字段类型提取特征;异常检测:预设数据异常检测方法库,与数据特征进行匹配以选取对应的异常检测方法并检测;任务调度编排:设置编排服务器和节点服务器,编排服务器根据任务请求将上述任务拆分为若干子步后分发给不同节点服务器处理。本发明提降低了数据资产管理和数据质量治理的门槛,实现数据质量稽核的通用性、规模化、自动化以及智能化,整体提升数据质量稽核的效率与工作质量。
-
公开(公告)号:CN110047016A
公开(公告)日:2019-07-23
申请号:CN201910337786.9
申请日:2019-04-25
申请人: 国网浙江省电力有限公司 , 浙江华云信息科技有限公司
发明人: 黄建平 , 钱仲文 , 张旭东 , 夏洪涛 , 王文 , 杨少杰 , 王政 , 陈浩 , 张建松 , 沈思琪 , 正卓凡 , 毛宾一 , 吴敏彦 , 王亿 , 陈显辉 , 黄杰 , 王炎 , 陈耀军 , 沈峰 , 周明磊 , 纪德良
IPC分类号: G06Q50/06 , G06F16/245 , G06K9/62
摘要: 本发明公开了一种基于Spark Streaming的流式大规模电力数据分析方法,步骤如下:第一步,利用SS树进行在线电力数据流的相似性搜索,以对电力数据进行聚类;第二步,改进的Spark并行K均值聚类法对离线电力数据流进行聚类,K均值聚类的聚类中心和类数初始值采用第一步所获得的聚类中心。本发明方法在UCI数据集上的实验评估表明,本发明方法优于传统的K均值聚类算法。同时,通过对用户真实数据集的测试发现,本发明可以快速有效地对用户的电力数据进行聚类。
-
公开(公告)号:CN108664562A
公开(公告)日:2018-10-16
申请号:CN201810315024.4
申请日:2018-04-10
申请人: 华东师范大学 , 国网浙江省电力有限公司 , 浙江华云信息科技有限公司
摘要: 本发明公开了一种基于粒子群优化的文本特征选择方法,该方法是为了解决采用空间向量模型表示文本出现文本特征向量高维且稀疏的问题,本发明将局部搜索策略嵌入到粒子群优化算法中选择出不相关和显著的特征子集,通过考虑粒子群的相关信息来指导粒子群算法在搜索过程中选择不同的特征,从而从原始特征中选择出更加有利于分类准确率的特征。本发明能够从庞大文本词集中选择出最有利于文本表示的特征子集,从而能为文本的分类、文本处理打下良好的基础。
-
-
-
-
-
-
-
-
-