-
公开(公告)号:CN119322847A
公开(公告)日:2025-01-17
申请号:CN202411176854.5
申请日:2024-08-26
Applicant: 国网智能电网研究院有限公司 , 中国电力科学研究院有限公司 , 国网江苏省电力有限公司 , 国家电网有限公司
IPC: G06F16/35 , G06F16/36 , G06F18/214 , G06F18/241
Abstract: 本申请属于一种数据处理方法,针对目前利用图谱构建和关系抽取技术时,采用人工标注的方式难以应对不断变化的业务场景,无法保证对应模型训练的时效性和灵活性的技术问题,提供一种数据增强方法、系统、电子设备、计算机存储介质,对初始样本中的实体和关系进行标记,并分类整理得到实体字典,对标记样本中文本的实体进行替换,并对替换后的实体进行标记,得到第一增广样本。构建关系模板和句式模板,通过句式模板重新表述替换后的第一增广样本中的文本,结合实体字典,对重新表述后的第一增广样本中文本的实体和关系进行替换,得到第二增广样本,再汇总融合第一增广样本和所述第二增广样本,得到增强后的数据。
-
公开(公告)号:CN118194171A
公开(公告)日:2024-06-14
申请号:CN202410155790.4
申请日:2024-02-04
Applicant: 国网智能电网研究院有限公司 , 国家电网有限公司大数据中心 , 国网安徽省电力有限公司信息通信分公司 , 国家电网有限公司
IPC: G06F18/2431 , G06F18/25 , G06Q50/06
Abstract: 本发明提供了基于元学习的多模态电力样本分类方法,涉及新一代信息技术领域,包括:获取待分类的多模态数据;基于预先训练好的电力样本分类学习器对所述待分类的多模态数据进行分类;其中,所述电力样本分类学习器是遍历拟合任务类别标签对多组多模态数据进行关联分析得到关联电力节点和关联模态数据,基于所述关联电力节点和关联模态数据对电力样本分类学习器进行训练,结合元学习器更新电力样本分类学习器的参数得到。解决现有技术中由于大模型的训练收敛速度较慢,训练数据的需求量较多,导致存在电力样本分类模型训练效率较差的技术问题。
-
公开(公告)号:CN117609278A
公开(公告)日:2024-02-27
申请号:CN202311774783.4
申请日:2023-12-21
Applicant: 国网智能电网研究院有限公司 , 国家电网有限公司大数据中心 , 国网安徽省电力有限公司信息通信分公司 , 国家电网有限公司
IPC: G06F16/242 , G06F16/23 , G06F16/215 , G06F18/22 , G06N3/0499 , G06N3/09 , G06Q50/06
Abstract: 本发明涉及数据识别技术领域,公开了基于深度度量学习的多模态电力数据管理方法与系统,本发明提供的方法包括:获取多模态电力数据库;获取预定电力数据模态属性集;基于预设电力数据模态属性对多模态电力数据库进行特征识别,获得多个数据模态特征;基于多个数据模态特征进行深度度量学习,获得多个深度模态特征;基于预设电力数据模态属性,根据多个深度模态特征进行深度学习,构建电力数据多模态搜索模型;根据电力数据多模态搜索模型对多模态电力数据库进行数据管理。通过本发明提供的方法实现多模态数据的统一管理,提高电力数据的多模态搜索能力和多模态相似匹配准确性,提高电力数据的多模态搜索能力,以及多模态相似匹配准确性。
-
公开(公告)号:CN111553442B
公开(公告)日:2024-03-12
申请号:CN202010397834.6
申请日:2020-05-12
Applicant: 国网智能电网研究院有限公司 , 国家电网有限公司 , 国家电网有限公司信息通信分公司 , 国网山东省电力公司信息通信公司
IPC: G06F18/241 , G06F18/214
Abstract: 本发明公开了一种分类器链标签序列的优化方法及系统,方法包括:获取待分类的输入样本;利用分类器链模型识别输入样本,生成样本标签集合,组成分类器链;利用共现分析获取样本标签集合对应的共现矩阵;利用共现矩阵的多个共现分支组成共现向量;根据共现向量获取分类器链的起始分支,基于贪心策略生成分类器链标签的顺序。本发明提出了分类器链对应的标签顺序生成策略,通过加快算法生成标签序列,耗时少,得到的分类器链的标签序列准确率高,实现了对原有分类器链模型的性能优化。
-
公开(公告)号:CN118607623A
公开(公告)日:2024-09-06
申请号:CN202410698148.0
申请日:2024-05-31
Applicant: 国网智能电网研究院有限公司 , 国网浙江省电力有限公司 , 国家电网有限公司
Abstract: 本发明提出了一种基于自然语言处理技术的知识图谱自动更新方法,该基于自然语言处理技术的知识图谱自动更新方法通过四个关键步骤实现:建立语义解析模型,利用知识图谱表示技术映射更新请求,智能化更新策略调整更新方式,以及通过自动化测试和验证系统进行全面验证。此外,方法还应用机器学习算法优化更新策略,以应对图谱规模扩大所带来的挑战。该方案的创新在于智能化的更新流程,利用人工智能和自然语言处理技术实现自动化更新和修正,从而降低人工干预和错误风险,提高效率和准确性,简化图谱维护过程。
-
公开(公告)号:CN117556086A
公开(公告)日:2024-02-13
申请号:CN202311368456.9
申请日:2023-10-20
Applicant: 国网智能电网研究院有限公司 , 国家电网有限公司
IPC: G06F16/901 , G06F16/903 , G06F16/9032
Abstract: 本发明涉及多跳路径查询技术领域,具体涉及一种多跳路径查询方法、装置、计算机设备及存储介质,本发明在图数据库中同时确定多组路径查询单元,基于每组路径查询单元中相互通信且相邻的第三实体和第四实体之间的包含关系、实体类型,通过路径关联度初始值更新第四实体的路径关联度当前值,当查询到目标实体,并将第四实体的路径关联度当前值作为目标实体的路径关联度最终值,并从目标实体的所有目标查询路径中选取最优查询路径以得到目标实体,可以实现基于图数据库缩小目标实体的多跳路径的查询范围,以免在图数据库中基于编写的属性信息逐次查询目标实体,进而达到简化查询过程以及提高查询效率的目的。
-
公开(公告)号:CN117556086B
公开(公告)日:2024-08-27
申请号:CN202311368456.9
申请日:2023-10-20
Applicant: 国网智能电网研究院有限公司 , 国家电网有限公司
IPC: G06F16/901 , G06F16/903 , G06F16/9032
Abstract: 本发明涉及多跳路径查询技术领域,具体涉及一种多跳路径查询方法、装置、计算机设备及存储介质,本发明在图数据库中同时确定多组路径查询单元,基于每组路径查询单元中相互通信且相邻的第三实体和第四实体之间的包含关系、实体类型,通过路径关联度初始值更新第四实体的路径关联度当前值,当查询到目标实体,并将第四实体的路径关联度当前值作为目标实体的路径关联度最终值,并从目标实体的所有目标查询路径中选取最优查询路径以得到目标实体,可以实现基于图数据库缩小目标实体的多跳路径的查询范围,以免在图数据库中基于编写的属性信息逐次查询目标实体,进而达到简化查询过程以及提高查询效率的目的。
-
公开(公告)号:CN118467668A
公开(公告)日:2024-08-09
申请号:CN202410475143.1
申请日:2024-04-19
Applicant: 国网智能电网研究院有限公司 , 国网浙江省电力有限公司电力科学研究院 , 国家电网有限公司
IPC: G06F16/31 , G06F40/20 , G06N3/0442 , G06N3/048 , G06F16/35 , G06F18/213 , G06F18/25 , G06F40/126 , G06N3/08
Abstract: 本发明涉及自然语言处理技术领域,具体提供了一种基于深度学习的电力舆情事件抽取方法及装置,包括:将电力舆情文本作为预先构建的事件检测模型的输入,得到所述预先构建的事件检测模型输出的电力舆情文本所属的事件类别编码;将所述电力舆情文本及其所属的事件类别编码作为预先构建的论元角色抽取模型的输入,得到所述预先构建的论元角色抽取模型输出的所述电力舆情文本的论元角色标注结果。本发明提供的技术方案,可以从大量的电力舆情文本中自动、快捷的将其包含的事件信息抽取出来,最终使得非结构化的数据规范成结构化的数据进行呈现。
-
公开(公告)号:CN110968692B
公开(公告)日:2023-04-07
申请号:CN201911010301.1
申请日:2019-10-23
Applicant: 全球能源互联网研究院有限公司 , 国网江苏省电力有限公司 , 国网江苏省电力有限公司电力科学研究院 , 国家电网有限公司
Abstract: 本发明公开了一种文本分类方法及系统,方法包括:获取待分类文本的父标签并转化为父标签词索引向量;将父标签词索引向量与文本词索引向量进行父标签嵌入操作得到文本词索引表征,然后进行转化生成待分类文本的语义向量;利用神经元有序的循环神经网络学习语义向量的层次结构,对层次结构的各层参数进行训练输出文本表征;利用多层感知器对文本表征进行非线性操作,获取待分类文本各层标签对应的概率分布;根据文本最后一层标签的概率分布获取文本分类结果。本发明将神经元有序的循环神经网络和多层感知器的组合模型处理大量标签的文本分类任务,涉及的参数少收敛速度快,通过对文本进行逐层的方式,与现有的平面分类器相比,大大提高了分类性能。
-
公开(公告)号:CN110968692A
公开(公告)日:2020-04-07
申请号:CN201911010301.1
申请日:2019-10-23
Applicant: 全球能源互联网研究院有限公司 , 国网江苏省电力有限公司 , 国网江苏省电力有限公司电力科学研究院 , 国家电网有限公司
Abstract: 本发明公开了一种文本分类方法及系统,方法包括:获取待分类文本的父标签并转化为父标签词索引向量;将父标签词索引向量与文本词索引向量进行父标签嵌入操作得到文本词索引表征,然后进行转化生成待分类文本的语义向量;利用神经元有序的循环神经网络学习语义向量的层次结构,对层次结构的各层参数进行训练输出文本表征;利用多层感知器对文本表征进行非线性操作,获取待分类文本各层标签对应的概率分布;根据文本最后一层标签的概率分布获取文本分类结果。本发明将神经元有序的循环神经网络和多层感知器的组合模型处理大量标签的文本分类任务,涉及的参数少收敛速度快,通过对文本进行逐层的方式,与现有的平面分类器相比,大大提高了分类性能。
-
-
-
-
-
-
-
-
-