-
公开(公告)号:CN108563735B
公开(公告)日:2021-07-27
申请号:CN201810315126.6
申请日:2018-04-10
Applicant: 国网浙江省电力有限公司 , 浙江华云信息科技有限公司 , 华东师范大学
IPC: G06F16/33 , G06F16/31 , G06F40/284
Abstract: 本发明公开了一种基于词语关联的数据分割搜索方法,该方法采用Apriori算法向下闭合来提取文本的频繁词集,根据活动的支持度选取文本恰当频繁词集合来分割文本,结合文本词向量空间模型来帮助选取分割的文本构建索引的索引关键词词集,完成文本搜索的还原工作。本发明能够达到原始的设计要求,同其它搜索方法相比,搜索更具有准确性,而且用户可以自定义部分算法的变量来调整索引,具有良好的扩展性。
-
公开(公告)号:CN108664562A
公开(公告)日:2018-10-16
申请号:CN201810315024.4
申请日:2018-04-10
Applicant: 华东师范大学 , 国网浙江省电力有限公司 , 浙江华云信息科技有限公司
Abstract: 本发明公开了一种基于粒子群优化的文本特征选择方法,该方法是为了解决采用空间向量模型表示文本出现文本特征向量高维且稀疏的问题,本发明将局部搜索策略嵌入到粒子群优化算法中选择出不相关和显著的特征子集,通过考虑粒子群的相关信息来指导粒子群算法在搜索过程中选择不同的特征,从而从原始特征中选择出更加有利于分类准确率的特征。本发明能够从庞大文本词集中选择出最有利于文本表示的特征子集,从而能为文本的分类、文本处理打下良好的基础。
-
公开(公告)号:CN108563735A
公开(公告)日:2018-09-21
申请号:CN201810315126.6
申请日:2018-04-10
Applicant: 国网浙江省电力有限公司 , 浙江华云信息科技有限公司 , 华东师范大学
Abstract: 本发明公开了一种基于词语关联的数据分割搜索方法,该方法采用Apriori算法向下闭合来提取文本的频繁词集,根据活动的支持度选取文本恰当频繁词集合来分割文本,结合文本词向量空间模型来帮助选取分割的文本构建索引的索引关键词词集,完成文本搜索的还原工作。本发明能够达到原始的设计要求,同其它搜索方法相比,搜索更具有准确性,而且用户可以自定义部分算法的变量来调整索引,具有良好的扩展性。
-
公开(公告)号:CN108664562B
公开(公告)日:2019-10-01
申请号:CN201810315024.4
申请日:2018-04-10
Applicant: 华东师范大学 , 国网浙江省电力有限公司 , 浙江华云信息科技有限公司
Abstract: 本发明公开了一种基于粒子群优化的文本特征选择方法,该方法是为了解决采用空间向量模型表示文本出现文本特征向量高维且稀疏的问题,本发明将局部搜索策略嵌入到粒子群优化算法中选择出不相关和显著的特征子集,通过考虑粒子群的相关信息来指导粒子群算法在搜索过程中选择不同的特征,从而从原始特征中选择出更加有利于分类准确率的特征。本发明能够从庞大文本词集中选择出最有利于文本表示的特征子集,从而能为文本的分类、文本处理打下良好的基础。
-
公开(公告)号:CN113591485A
公开(公告)日:2021-11-02
申请号:CN202110671379.9
申请日:2021-06-17
Applicant: 国网浙江省电力有限公司 , 国网浙江省电力有限公司信息通信分公司 , 浙江华云信息科技有限公司
IPC: G06F40/30 , G06F40/289 , G06F40/242 , G06K9/46 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于数据科学的智能化数据质量稽核系统及方法,方法包括:数据采集:进行检测对象元数据采集以及日志数据采集解析;数据特征提取:识别并剔除无效表和无效字段,同时通过修订算法根据数据内容对字段类型进行自动修订,根据字段类型提取特征;异常检测:预设数据异常检测方法库,与数据特征进行匹配以选取对应的异常检测方法并检测;任务调度编排:设置编排服务器和节点服务器,编排服务器根据任务请求将上述任务拆分为若干子步后分发给不同节点服务器处理。本发明提降低了数据资产管理和数据质量治理的门槛,实现数据质量稽核的通用性、规模化、自动化以及智能化,整体提升数据质量稽核的效率与工作质量。
-
公开(公告)号:CN113591485B
公开(公告)日:2024-07-12
申请号:CN202110671379.9
申请日:2021-06-17
Applicant: 国网浙江省电力有限公司 , 国网浙江省电力有限公司信息通信分公司 , 浙江华云信息科技有限公司
IPC: G06F40/30 , G06F40/289 , G06F40/242 , G06V10/42 , G06V10/75 , G06V10/762 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于数据科学的智能化数据质量稽核系统及方法,方法包括:数据采集:进行检测对象元数据采集以及日志数据采集解析;数据特征提取:识别并剔除无效表和无效字段,同时通过修订算法根据数据内容对字段类型进行自动修订,根据字段类型提取特征;异常检测:预设数据异常检测方法库,与数据特征进行匹配以选取对应的异常检测方法并检测;任务调度编排:设置编排服务器和节点服务器,编排服务器根据任务请求将上述任务拆分为若干子步后分发给不同节点服务器处理。本发明提降低了数据资产管理和数据质量治理的门槛,实现数据质量稽核的通用性、规模化、自动化以及智能化,整体提升数据质量稽核的效率与工作质量。
-
公开(公告)号:CN115292381A
公开(公告)日:2022-11-04
申请号:CN202210713401.6
申请日:2022-06-22
Applicant: 浙江华云信息科技有限公司 , 国网浙江省电力有限公司 , 国网浙江省电力有限公司衢州供电公司
Abstract: 本发明提供了一种基于极限梯度提升算法的虚拟货币挖矿行为识别方法,所述识别方法具体为选择识别区域,根据对应的历史稽查信息,根据历史稽查信息对完成现场稽查的用电用户的历史用电数据添加标签,构建已标注数据集,并根据其他用电用户的历史用电数据构建未标注数据集,对两个数据集进行特征提取,构建特征数据集作为输入,使用极限梯度提升算法通过半监督学习方法对挖矿用户甄别模型进行训练,确定所有待识别用户并采集对应的用电数据,提取用电特征数据,将提取的用电特征数据输入挖矿用户甄别模型,获取待识别用户中的挖矿用户,并对其添加挖矿用户标签。本发明能够准确且有效的识别挖矿用户,并适用于大量用电数据识别的场景。
-
公开(公告)号:CN109388733B
公开(公告)日:2022-01-07
申请号:CN201810916036.2
申请日:2018-08-13
Applicant: 国网浙江省电力有限公司 , 浙江华云信息科技有限公司 , 国网浙江仙居县供电有限公司
IPC: G06F16/901 , G06F9/448
Abstract: 本发明提出一种新的图数据处理引擎优化方法,其特征在于,采用本地迭代,全局通信的处理方式,所述处理方式首先在同一计算节点上开展计算,直到该计算节点上的所有图节点的数据都完成更新则停止局部迭代;在同一计算节点上开展计算的同时,边缘图节点缓存并合并消息,待局部迭代停止后批量传输计算节点间发送的消息,所述边缘图节点为跨两个或多个计算节点的图节点。
-
公开(公告)号:CN107239880B
公开(公告)日:2021-01-26
申请号:CN201710306242.7
申请日:2017-05-03
Applicant: 国网浙江省电力有限公司 , 华北电力大学 , 浙江华云信息科技有限公司
Inventor: 张旭东 , 牛东晓 , 张彩友 , 李雅 , 夏慧聪 , 宋国超 , 施婧 , 王锋华 , 施永益 , 张建松 , 陈浩 , 陈铁义 , 王珂 , 余侃 , 金程 , 项丹圆 , 杨扬 , 王晓辉 , 陈俊
Abstract: 本发明公开了一种基于设备寿命统计分析的电网技改资金需求测算模型。通过计算某时间点上各类设备达到寿命期末,需要技改投资的概率,测算技改投资需求随时间变化的关系。本发明用于电网企业测算技改投资需求,帮助电网企业安排投资计划,保障电力设备的可靠运行。
-
公开(公告)号:CN116361277A
公开(公告)日:2023-06-30
申请号:CN202310234256.8
申请日:2023-03-08
Applicant: 国网浙江省电力有限公司信息通信分公司 , 浙江华云信息科技有限公司
IPC: G06F16/215 , G06F16/242
Abstract: 本申请提供一种数据质量检测方法、装置、计算机设备及介质,获取数据中台的目标系统的第一数据,第一数据包括目标字段;对目标字段进行特征标记,得到目标字段对应的目标特征;根据目标特征和预设对应关系,得到目标特征对应的目标质量检测算法;通过PyODPS内置的聚合函数,利用目标质量检测算法对目标字段进行质量检测,得到包括异常数据的检测结果。对多个目标字段进行质量检测时,在数据中台中可以采用多字段并行检测方式,同时,在对多个目标字段中的每一个目标字段进行检测时,PyODPS内置的聚合函数可以调用数据中台内线程级别的多路并发能力,充分利用数据中台的集群资源进行质量检测,提高对数据质量的检测效率。
-
-
-
-
-
-
-
-
-