-
公开(公告)号:CN109597928B
公开(公告)日:2022-12-16
申请号:CN201811483053.8
申请日:2018-12-05
Applicant: 云南电网有限责任公司信息中心
IPC: G06F16/951 , G06F16/35
Abstract: 一种支持用户策略配置的基于Web网络的非结构化文本获取方法,包括文本采集器存储初始化步骤,文本采集器种子地址初始化步骤,文本采集器页面资源获取步骤,页面分析与存储步骤,页面文本内容层次聚类步骤,文本数据聚类情况反馈步骤,实时/准实时用户策略配置步骤,文本采集器响应用户反馈步骤。本发明能够对已爬取的资源的评估来动态地调整Web网络文本采集系统即网络爬虫的选择策略,实现在一个特定的组织内更好与更高效的文本数据采集与高质量的文本数据资源池的构建,实现在很短的时期内即可将具有丰富特征的文本数据建立起信息资源池,提高爬虫效率,节省信息采集的周期。
-
公开(公告)号:CN111507891A
公开(公告)日:2020-08-07
申请号:CN202010288204.5
申请日:2020-04-14
Applicant: 云南电网有限责任公司信息中心
IPC: G06T3/00
Abstract: 本申请涉及一种基于CUDA的数字图像几何变换方法、基于CUDA的数字图像几何变换装置、计算机设备及计算机可读存储介质,上述方法包括:根据纹理内存拾取纹理参数;根据所述纹理参数,得到源图片的纹理坐标;对所述纹理坐标进行坐标变换,以得到参考图像坐标;以及根据所述参考图像坐标,得到并显示数字图像。上述基于CUDA的数字图像几何变换方法,能够进行高速缓存从而提高图像转换速度,并且所受限制较少。
-
公开(公告)号:CN109508261B
公开(公告)日:2019-12-13
申请号:CN201811010693.7
申请日:2018-08-31
Applicant: 云南电网有限责任公司信息中心 , 国网信通亿力科技有限责任公司 , 国网信息通信产业集团有限公司 , 国家电网有限公司
Abstract: 本发明涉及一种基于大数据的电网数据节点备份方法及系统,该系统包括主服务器组和备份服务器组,其中主服务器组包括N个互不连接的主服务器,用于存储数据并接受客户端的读写访问操作,而备份服务器组包括N个连接为环形网络的备份服务器,其用于备份对应主服务器的数据,并在主服务器失效时向客户端提供服务。备份服务器组中的每一个备份服务器的存储空间划分为两部分,其中第一部分用于对其所对应的主服务器进行热备份,第二部分为可用的存储部分,在其相邻的备份服务器无法工作时,其可以提供存储空间供客户端进行写入数据的操作。
-
公开(公告)号:CN109522367B
公开(公告)日:2019-10-18
申请号:CN201810993413.2
申请日:2018-08-29
Applicant: 云南电网有限责任公司信息中心 , 国网信通亿力科技有限责任公司 , 国网信息通信产业集团有限公司 , 国家电网有限公司
Abstract: 一种基于IEC61970/61968标准的电网统一信息模型的数据处理装置和方法,其包括信息模型构建模块、数据接收模块、数据处理模块和数据装载模块;其中,所述数据处理模块还包括数据判断与裁决子模块,用于当标准统一信息模型所需的数据记录当出现空缺值。通过本发明提供的装置和方法,能够有效的处理电网统一信息模型的数据,提高数据交互性,同时提高了数据处理效率和实用效率。
-
公开(公告)号:CN109508374A
公开(公告)日:2019-03-22
申请号:CN201811373404.X
申请日:2018-11-19
Applicant: 云南电网有限责任公司信息中心
Abstract: 基于遗传算法的半监督文本聚类方法,可以应用到各专业领域如电力行业数据的文本数据分析中,通过tftdf将文本数据集中的文本进行特征权计算,并将根据特征权值进行初始聚类计算,按照遗传算法,将文本内重要特征词间平衡距离作为分类适应度,实现聚类结果的优化。通过人机交互对聚类结果进行审阅并根据经验知识对聚类结果进行修改和调整,再次运用遗传算法进行调整后聚类的迭代与二次优化,达到最终文本聚类的效果。本方法有效结合了文本数据无监督聚类方法的易用性与有监督聚类方法的准确性及计算高效性,能够有效平衡通常文本数据聚类分析与人工分类结果差别太大及计算资源消耗过多等问题,改善了文本聚类的运行效果。
-
公开(公告)号:CN107341198A
公开(公告)日:2017-11-10
申请号:CN201710466965.3
申请日:2017-06-16
Applicant: 云南电网有限责任公司信息中心 , 昆明能讯科技有限责任公司
IPC: G06F17/30
Abstract: 一种基于主题实例的电力海量数据存储与查询方法,将电力海量数据分成静态数据和电网运行数据,将电网设备台账、设备技术参数、监测终端信息以及终端监测属性等静态数据以结构化的方式建立主题实例模型;将电网运行数据基于列式存储方案存储在HBase列式数据库中;本发明的有益效果是:提供统一的模型对电网设备状态监测进行高效、可靠地存储,并快速访问和分析,降低开发成本,提高开发效率。
-
公开(公告)号:CN109522549B
公开(公告)日:2022-06-10
申请号:CN201811273931.3
申请日:2018-10-30
Applicant: 云南电网有限责任公司信息中心
IPC: G06F40/216 , G06F40/289 , G06F16/35 , G06F16/9535 , G06Q50/06
Abstract: 一种基于Web采集与文本特征均衡分布的语料库构建方法,利用Web进行语料收集,采用基于词典的方式对预处理后的生语料进行标注,利用代表性度量模型对语料素材在语料库中的代表性进行量化并排序,形成按照降序排列的语料素材序列,利用这些序列可以实现任意规模的最逼近的语料子库。例如可以通过增量方式对电力语料库进行更新,从而建立起能够自由扩充的电力行业专用语料库。同时量化排序后的语料素材序列支持对语料库进行子集化操作,即取得一部分语料库的素材,使其尽可能地代表原始语料库的相关特性,从而开展语料库的离线应用。
-
公开(公告)号:CN107341198B
公开(公告)日:2020-05-12
申请号:CN201710466965.3
申请日:2017-06-16
Applicant: 云南电网有限责任公司信息中心 , 昆明能讯科技有限责任公司
IPC: G06F16/2458 , G06F16/2453 , G06F16/22 , G06F16/25
Abstract: 一种基于主题实例的电力海量数据存储与查询方法,将电力海量数据分成静态数据和电网运行数据,将电网设备台账、设备技术参数、监测终端信息以及终端监测属性等静态数据以结构化的方式建立主题实例模型;将电网运行数据基于列式存储方案存储在HBase列式数据库中;本发明的有益效果是:提供统一的模型对电网设备状态监测进行高效、可靠地存储,并快速访问和分析,降低开发成本,提高开发效率。
-
公开(公告)号:CN109522549A
公开(公告)日:2019-03-26
申请号:CN201811273931.3
申请日:2018-10-30
Applicant: 云南电网有限责任公司信息中心
IPC: G06F17/27 , G06F16/35 , G06F16/9535 , G06Q50/06
Abstract: 一种基于Web采集与文本特征均衡分布的语料库构建方法,利用Web进行语料收集,采用基于词典的方式对预处理后的生语料进行标注,利用代表性度量模型对语料素材在语料库中的代表性进行量化并排序,形成按照降序排列的语料素材序列,利用这些序列可以实现任意规模的最逼近的语料子库。例如可以通过增量方式对电力语料库进行更新,从而建立起能够自由扩充的电力行业专用语料库。同时量化排序后的语料素材序列支持对语料库进行子集化操作,即取得一部分语料库的素材,使其尽可能地代表原始语料库的相关特性,从而开展语料库的离线应用。
-
公开(公告)号:CN109522298A
公开(公告)日:2019-03-26
申请号:CN201810993857.6
申请日:2018-08-29
Applicant: 云南电网有限责任公司信息中心 , 国网信通亿力科技有限责任公司 , 国网信息通信产业集团有限公司 , 国家电网有限公司
IPC: G06F16/215
Abstract: 本发明涉及一种用于CIM的数据清洗方法,包括以下步骤:步骤S100,获得数据源的格式化数据,并将格式化数据转换为数据表,所述数据表中的每一行为一条记录,每一列为一个字段;步骤S200,遍历数据表中的所有字段,如果某个字段F的字段类型为文本型,那么提取所述字段F中文本数量最多的N条记录中的文本,形成文本集T;步骤S300,从k个微分词库{D1,D2,...,Dk}中,确定文本集T对应的微分词库Dt,其中t的取值范围为1…k;步骤S400,使用微分词库Dt对每条记录的字段F进行分词,形成分词文本标签;步骤S500,将每条记录中的所述分词文本标签填充到CIM对应的数据中。
-
-
-
-
-
-
-
-
-