-
公开(公告)号:CN118886422A
公开(公告)日:2024-11-01
申请号:CN202410785096.0
申请日:2024-06-18
申请人: 贵州电网有限责任公司
IPC分类号: G06F40/284 , G06F40/216 , G06F40/242 , G06F40/30 , G06F18/2135 , G06F18/24 , G06F18/25
摘要: 本发明公开了自然语言处理技术的文档分类与热点话题生成方法及系统,涉及自然语言处理技术领域,包括:收集需要分类的原始文档数据集;使用分词算法将原始文档数据集切分为词汇单元;基于词汇单元对文档数据集进行基本特征提取;通过基本特征对原始文档数据集进行类别划分,获得分类文档;获取话题在分类文档中分布和关联,并识别出高频话题作为热点话题。本发明显著提高了文档处理的效率和准确性。通过结合基于规则和基于统计的分词方法,精确的TF‑IDF特征提取技术以及先进的潜在狄利克雷分配(LDA)模型,本发明能够有效处理大规模文档数据集,精准地识别并提取关键特征,以及准确地生成和识别热点话题。
-
公开(公告)号:CN117435729A
公开(公告)日:2024-01-23
申请号:CN202311262449.0
申请日:2023-09-27
申请人: 贵州电网有限责任公司
IPC分类号: G06F16/35 , G06F16/33 , G06F16/36 , G06F16/901 , G06F16/338 , G06Q50/06
摘要: 本发明公开了一种利用多维度融合对电力企业开放数据方案进行合规检测的方法。首先基于电力数据安全分类分级指南,结合数据项名称、数据类型、拼音转换、同义词和全文检索等元素,构建了电网数据类型图谱。接下来,通过为每个词根建立正则表达式识别规则,实现自动识别上传的数据项清单中的数据类型信息。此外,系统能够自动匹配、检索数据项,并根据开放用途、数据量和预估主体数量来决定脱敏和审批要求。最后,所有的检测结果将被自动整合为一个检测报告。本发明大大提高了电力数据开放合规检测的效率和准确性。
-
公开(公告)号:CN117236334A
公开(公告)日:2023-12-15
申请号:CN202311355961.X
申请日:2023-10-18
申请人: 贵州电网有限责任公司
IPC分类号: G06F40/295 , G06F40/30 , G06F18/241 , G06F18/22
摘要: 本发明公开了一种项目数据安全信息分级处理方法,涉及数据安全信息分级技术领域,利用数据合规库提取数据安全判定规则,形成数据安全词库;使用自然语言处理技术,基于数据安全词库和语义情境分析,建立自动分级判断模型;利用模型对数据库数据进行格式和语义识别,并基于识别结果,判断数据内容的安全性、合规性和敏感性;计算数据实体与安全词库的相关程度,自动识别敏感程度,并基于数据实体的安全特征对数据实体划分安全等级。本发明提高数据安全分级的智能化水平,减少人工工作量,提升数据处理效率;应用自然语言处理和深度学习技术,提升对非结构化数据的理解和处理能力。
-
公开(公告)号:CN116126953A
公开(公告)日:2023-05-16
申请号:CN202211514744.6
申请日:2022-11-29
申请人: 贵州电网有限责任公司
摘要: 本发明公开了一种电网数据共享平台及构建方法;包括数据服务管理系统,所述数据服务管理系统用于对所述电网数据共享平台中的所有子系统进行对象关系管理,本发明基于共享服务架构,将公司资源、系统和数据上升为“企业级”,实现业务和资源的进一步整合优化,通过电网数据共享平台共享服务建设,一方面共享服务将为跨域的业务应用提供更强大的数据及流程服务能力,进一步提升了公司内部生产运营及对外服务管理水平,另一方面将同步推动企业组织架构变革,提高核心团队的理论水平、技术能力和协作水平,通过采用云部署方式,加强资源共享,减轻维护工作量。
-
公开(公告)号:CN115729899A
公开(公告)日:2023-03-03
申请号:CN202211522988.9
申请日:2022-11-30
申请人: 贵州电网有限责任公司
IPC分类号: G06F16/16 , G06F16/182 , G06F16/13
摘要: 本发明公开了一种基于分布式文件系统流式数据实时更新插入合并处理方法,所述方法包括:步骤1、在分布式文件系统上对接入的流式数据以单个表为单位按时间间隔进行分区操作;步骤2、采用流数据中主键字段的值作为该条数据的key值;步骤3、将数据的key值和当前数据所在的分区号建立唯一映射关系,把这种映射关系存放在第三方数据库中,利用第三方数据库完成索引的构建;步骤4、当每条流式数据开始接入时,执行更新或插入操作;步骤5、根据触发机制来对分区文件夹中的文件进行合并;解决了现有技术的分布式文件系统中无法实时对流数据更新插入的合并操作。
-
公开(公告)号:CN117931747A
公开(公告)日:2024-04-26
申请号:CN202311752642.2
申请日:2023-12-19
申请人: 贵州电网有限责任公司
摘要: 本申请涉及一种用于数据集市的元数据管理方法、装置、系统和设备。该数据集市基于GreenPlum数据库构建,方法包括:获取数据集市的归档日志数据;根据归档日志数据进行操作类型信息筛选处理,得到数据集市对应的操作日志数据;将操作日志数据发送至元数据传输组件,以供Atlas数据治理平台从元数据传输组件获取操作日志数据以及根据操作日志数据更新数据集市对应的元数据;Atlas数据治理平台中包括GreenPlum数据库对应的元数据类型。采用本方法能够提高对数据集市的元数据管理的效率。
-
公开(公告)号:CN117493433A
公开(公告)日:2024-02-02
申请号:CN202311448533.1
申请日:2023-11-01
申请人: 贵州电网有限责任公司
IPC分类号: G06F16/25 , G06F16/22 , G06F16/2455 , G06F16/248 , G06Q50/06
摘要: 本申请涉及一种数据溯源方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:根据平台登录配置信息,获取目标业务平台的数据页面;基于所述数据页面,获取所述数据页面绑定的数据字段;根据预设转换规则,将所述数据字段转换为后台数据库对应的目标字段;根据各所述目标字段在所述后台数据库中进行查找,得到各所述目标字段对应的字段关联信息;对所述字段关联信息进行解析,得到所述目标业务平台的数据溯源信息。采用本方法能够提高目标业务平台数据管理的效率。
-
公开(公告)号:CN116842107A
公开(公告)日:2023-10-03
申请号:CN202310705646.9
申请日:2023-06-14
申请人: 贵州电网有限责任公司
摘要: 本申请涉及一种实时数据仓库构建方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:从电网业务系统中,实时获取用于计算预设电网指标的电网数据表;电网数据表包括电网事实表和电网维度表;基于电网事实表,得到待构建实时数据仓库的原始数据层,并基于电网维度表,得到待构建实时数据仓库的维度层;利用原始数据层以及所述维度层,得到待构建实时数据仓库的汇总数据层;根据预先得到的预设电网指标的计算模型,以及汇总数据层,得到待构建实时数据仓库的电网指标集市层。采用本方法能够实时地生成电网指标。
-
公开(公告)号:CN118132580A
公开(公告)日:2024-06-04
申请号:CN202311723673.5
申请日:2023-12-14
申请人: 贵州电网有限责任公司
IPC分类号: G06F16/242 , H02J13/00 , G06F16/25
摘要: 本申请涉及一种输电线路过载检测方法、装置和计算机设备,通过获取待检测线路段的实时电流数据;将所述实时电流数据转化为预设格式,并且写入Kafka消息队列;获取管理辖区内所有线路段对应的元数据信息,并且存储至数据库;利用实时计算引擎在所述数据库中查找与所述Kafka消息队列中的实时电流数据相匹配的目标元数据信息;基于所述目标元数据信息和所述待检测线路段的实时电流数据,对待检测线路段进行过载检测。上述输电线路过载检测方法,基于实时计算引擎和Kafka消息队列,能够及时并且精准的对输电线路过载情况进行检测,因而最大程度的降低安全风险。
-
公开(公告)号:CN118779465A
公开(公告)日:2024-10-15
申请号:CN202410800497.9
申请日:2024-06-20
申请人: 贵州电网有限责任公司
IPC分类号: G06F16/36 , G06F16/31 , G06F40/289 , G06N3/08 , G06N3/045 , G06F16/35 , G06F18/22 , G06F18/23 , G06Q50/06
摘要: 本发明公开了一种基于机器学习的能源行业知识图谱优化与更新方法,涉及电力系统技术领域,包括,获取与能源行业知识相关的结构化数据、半结构化数据、非结构化数据以及实时数据;对获取的数据进行数据清洗、标准化以及数据标注,得到数据集;采用深度学习模型对数据集进行实体识别和关系抽取,将实体和关系表示为三元组,生成知识图谱,并采用图数据库存储和管理所述知识图谱。本发明通过整合能源行业相关的数据到一个统一的数据集中,充分利用各种类型的数据,提高数据的全面性和准确性。
-
-
-
-
-
-
-
-
-