-
公开(公告)号:CN114996408A
公开(公告)日:2022-09-02
申请号:CN202210754571.9
申请日:2022-06-29
Applicant: 国家电网有限公司大数据中心
IPC: G06F16/33 , G06F16/35 , G06F40/211 , G06F40/295 , G06K9/62 , G06N3/04 , G06N3/08 , G06N5/02
Abstract: 本发明属于电力数据处理技术领域,尤其为一种基于Bert的面向非结构化电力数据的知识抽取方法及系统,该方法中,对触发词明显、句式和位置相对固定的知识,使用正则匹配方法抽取知识实体,对于非结构化电力数据中存在实体界限模糊和实体嵌套问题,通过基于Bert的知识抽取方法来抽取知识实体,然后再利用实体抽取的结果使用基于Bert的预训练语言模型进行关系和属性抽取,最终实现对非结构化电力数据的知识抽取,充分考虑了非结构化电力数据的句式和结构,适于非结构化电力数据的知识抽取,属于一种深度学习的知识抽取方法,而深度学习方法可以自动学习特征,采用低维、稠密的实值向量表示数据,避免了对人工和专家知识的严重依赖。
-
公开(公告)号:CN114139497B
公开(公告)日:2024-08-23
申请号:CN202111519931.9
申请日:2021-12-13
Applicant: 国家电网有限公司大数据中心
IPC: G06F40/126 , G06F40/194 , G06F40/30 , G06N3/0475 , G06N3/08
Abstract: 本发明属于文本摘要提取技术领域,尤其为一种基于BERTSUM模型的文本摘要提取方法先对需要提取摘要的文本进行预处理,然后将预处理后的数据输入改进的BERT模型进行处理,判断出应该出现在摘要中的句子,BERT模型的改进过程中,在BERT模型原本的损失函数中增加一个余弦相似度损失,避免了数据处理中过度拟合,使得获得的摘要更加准确;另外,通过加入余弦相似性约束,使得BERT模型在训练早期,获得的结果的损失能够更快的下降,提高数据处理的速度;BERT模型的改进方面还包括加入融合指针网络的UniLM模型,通过融合指针网络的UniLM模型对文本下游生成任务进行微调,提前获取文本中的关键信息词,提高文本摘要的获得速度。
-
公开(公告)号:CN114443664A
公开(公告)日:2022-05-06
申请号:CN202210105132.5
申请日:2022-01-28
Applicant: 国家电网有限公司大数据中心
Abstract: 本发明公开了用于多源异构数据的虚拟表管理方法、装置及存储介质,属于信息处理的技术领域,该方法包括:S1:创建虚拟表,定义虚拟表结构;S2:建立虚拟表与底层数据之间的映射关系,将底层数据源的数据转换为虚拟表中的数据;S3:对数据消费者授权虚拟表访问权限;S4:数据消费者通过界面浏览和查询虚拟表中的数据。本发明可以实现多源异构数据的自动化查询,可有效、快速地查询底层数据中的数据,有利于数据的发现、理解。
-
公开(公告)号:CN114139497A
公开(公告)日:2022-03-04
申请号:CN202111519931.9
申请日:2021-12-13
Applicant: 国家电网有限公司大数据中心
IPC: G06F40/126 , G06F40/194 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明属于文本摘要提取技术领域,尤其为一种基于BERTSUM模型的文本摘要提取方法先对需要提取摘要的文本进行预处理,然后将预处理后的数据输入改进的BERT模型进行处理,判断出应该出现在摘要中的句子,BERT模型的改进过程中,在BERT模型原本的损失函数中增加一个余弦相似度损失,避免了数据处理中过度拟合,使得获得的摘要更加准确;另外,通过加入余弦相似性约束,使得BERT模型在训练早期,获得的结果的损失能够更快的下降,提高数据处理的速度;BERT模型的改进方面还包括加入融合指针网络的UniLM模型,通过融合指针网络的UniLM模型对文本下游生成任务进行微调,提前获取文本中的关键信息词,提高文本摘要的获得速度。
-
公开(公告)号:CN117951424A
公开(公告)日:2024-04-30
申请号:CN202410138393.6
申请日:2024-01-31
Applicant: 国家电网有限公司大数据中心
IPC: G06F17/11 , G06F17/16 , G06Q30/018 , G06Q50/06 , G06Q50/40
Abstract: 本发明涉及碳排放核算技术领域,具体提供了一种高速铁路的电力牵引碳排放计算方法及装置,包括:确定高速铁路段的电铁牵引站的电力碳排放因子;基于所述高速铁路段的电铁牵引站的电力碳排放因子确定高速铁路段的电力牵引碳排放。本发明提供的技术方案,能够分地区、分路段、分时间计算高速铁路运营期间电力产的碳排放。
-
公开(公告)号:CN115170329A
公开(公告)日:2022-10-11
申请号:CN202210774591.2
申请日:2022-07-01
Applicant: 国家电网有限公司大数据中心
IPC: G06Q40/06 , G06Q10/06 , G06F16/903
Abstract: 本发明公开了一种科技项目的投资效益评价方法,通过获取当前项目和历史项目的投资数据;历史项目的投资数据包括:历史投资效益数据和对应的多个历史投资指标数据;历史项目和当前项目属于同一类科技项目;根据历史投资效益数据和每个历史投资指标数据的关联度确定当前项目的投资效益评价指标;根据投资效益评价指标和当前项目的投资数据评价当前项目的投资效益,能够为项目投资提供科学的投资指标选取与科技项目的投资效益评价方法,降低项目投资风险;辅助项目的投资预测与决策工作,简化科技项目的投资效益评价过程。
-
公开(公告)号:CN114064707A
公开(公告)日:2022-02-18
申请号:CN202111406126.5
申请日:2021-11-24
Applicant: 国家电网有限公司大数据中心
IPC: G06F16/2453 , G06F16/2455 , G06F16/22 , G06F16/25 , G06F16/907 , G06F9/54
Abstract: 本发明公开了一种基于数据虚拟化技术的数据查询方法、装置及存储介质,属于信息处理的技术领域,该方法包括:S1:基于用户的查询请求,查询引擎确定查询处理策略和性能优化措施;S2:查询数据服务层中是否存在对应的预先定义的虚拟表,如果存在,则进行步骤S3,如果不存在,则数据服务层生成对应的临时虚拟表,之后进行步骤S3;S3:数据映射层通过封装表实现虚拟表到底层数据源的映射;S4:采集适配器通过其内部的封装器采集底层数据源中的数据,并实现封装表数据的装载。本发明可实现多源异构数据的简单、有效、快速的自动化查询。
-
-
-
-
-
-