-
公开(公告)号:CN115357719B
公开(公告)日:2023-01-03
申请号:CN202211283079.4
申请日:2022-10-20
Applicant: 国网天津市电力公司培训中心 , 天津天源电力工程有限公司 , 天津市城西广源电力工程有限公司 , 天津市宁河区宁东盛源电力工程有限公司 , 国网天津市电力公司 , 国家电网有限公司
Inventor: 孟庆霖 , 穆健 , 戴斐斐 , 赵宝国 , 王霞 , 崔霞 , 宋岩 , 葛晓舰 , 吕元旭 , 赵战云 , 唐厚燕 , 王瑞 , 许良 , 徐业朝 , 徐晓萱 , 马剑 , 李常春 , 郭保伟 , 李婧
IPC: G06F16/35 , G06F16/36 , G06F40/284 , G06N3/04 , G06Q50/06
Abstract: 本发明公开一种基于改进BERT模型的电力审计文本分类方法及装置,其中分类方法包括:获取电力文本;构建EPAT‑BERT模型;将电力文本输入EPAT‑BERT模型进行预训练,获得预训练后的EPAT‑BERT模型;其中,预训练包括分别进行字粒度掩码语言模型训练和实体粒度的掩码语言模型训练;对预训练后的EPAT‑BERT模型进行微调后开展性能评价,确定文本分类EPAT‑BERT模型;将待分类的电力审计文本输入文本分类EPAT‑BERT模型,输出电力审计文本的类别标签。本发明提出的两种预训练任务,以大规模电力文本作为训练语料,把握电力文本中的词法、语法以及相关知识,实现电力审计文本的高效自动分类。
-
公开(公告)号:CN114372118B
公开(公告)日:2025-02-25
申请号:CN202111643446.2
申请日:2021-12-29
Applicant: 国网天津市电力公司 , 国家电网有限公司 , 国网天津市电力公司信息通信公司
IPC: G06F16/31 , G06F16/332 , G06F16/338 , G06F16/35 , G06F40/186
Abstract: 本发明涉及一种基于递归算法的审计知识推荐系统及方法,包括审计知识库模块、审计记录模块、审计底稿模块和审计报告模块;所述审计知识库模块与审计记录模块相连接,审计知识库为审计记录编辑内容智能推荐提供知识基础;所述审计记录模块与审计底稿模块相连接,审计记录实时线上编辑完成后,问题分类,将审计记录自动归集为审计底稿;所述审计底稿模块与审计报告模块相连接,将审计底稿通过问题分类合并汇总并自动生成审计报告。本发明能够增强审计工作的实效性和穿透力,工作效率得到提升,信息安全得以确保。
-
公开(公告)号:CN115357719A
公开(公告)日:2022-11-18
申请号:CN202211283079.4
申请日:2022-10-20
Applicant: 国网天津市电力公司培训中心 , 天津天源电力工程有限公司 , 天津市城西广源电力工程有限公司 , 天津市宁河区宁东盛源电力工程有限公司 , 国网天津市电力公司 , 国家电网有限公司
Inventor: 孟庆霖 , 穆健 , 戴斐斐 , 赵宝国 , 王霞 , 崔霞 , 宋岩 , 葛晓舰 , 吕元旭 , 赵战云 , 唐厚燕 , 王瑞 , 许良 , 徐业朝 , 徐晓萱 , 马剑 , 李常春 , 郭保伟 , 李婧
IPC: G06F16/35 , G06F16/36 , G06F40/284 , G06N3/04 , G06Q50/06
Abstract: 本发明公开一种基于改进BERT模型的电力审计文本分类方法及装置,其中分类方法包括:获取电力文本;构建EPAT‑BERT模型;将电力文本输入EPAT‑BERT模型进行预训练,获得预训练后的EPAT‑BERT模型;其中,预训练包括分别进行字粒度掩码语言模型训练和实体粒度的掩码语言模型训练;对预训练后的EPAT‑BERT模型进行微调后开展性能评价,确定文本分类EPAT‑BERT模型;将待分类的电力审计文本输入文本分类EPAT‑BERT模型,输出电力审计文本的类别标签。本发明提出的两种预训练任务,以大规模电力文本作为训练语料,把握电力文本中的词法、语法以及相关知识,实现电力审计文本的高效自动分类。
-
公开(公告)号:CN114492399A
公开(公告)日:2022-05-13
申请号:CN202111682272.0
申请日:2021-12-29
Applicant: 国网天津市电力公司 , 国家电网有限公司 , 国网天津市电力公司信息通信公司
IPC: G06F40/253 , G06F40/151 , G06F16/903
Abstract: 本发明涉及一种基于正则表达式的合同信息提取系统及方法,包括任务设置模块、数据采集模块、信息提取模块、数据存储模块和大数据分析模块。本发明通过正则表达式非结构化转换技术,提取关键信息,把信息存储为结构化的数据,根据固有的规则进行数据筛选。
-
公开(公告)号:CN114372118A
公开(公告)日:2022-04-19
申请号:CN202111643446.2
申请日:2021-12-29
Applicant: 国网天津市电力公司 , 国家电网有限公司 , 国网天津市电力公司信息通信公司
IPC: G06F16/31 , G06F16/332 , G06F16/338 , G06F16/35 , G06F40/186
Abstract: 本发明涉及一种基于递归算法的审计知识推荐系统及方法,包括审计知识库模块、审计记录模块、审计底稿模块和审计报告模块;所述审计知识库模块与审计记录模块相连接,审计知识库为审计记录编辑内容智能推荐提供知识基础;所述审计记录模块与审计底稿模块相连接,审计记录实时线上编辑完成后,问题分类,将审计记录自动归集为审计底稿;所述审计底稿模块与审计报告模块相连接,将审计底稿通过问题分类合并汇总并自动生成审计报告。本发明能够增强审计工作的实效性和穿透力,工作效率得到提升,信息安全得以确保。
-
公开(公告)号:CN116245107A
公开(公告)日:2023-06-09
申请号:CN202310532316.4
申请日:2023-05-12
Applicant: 国网天津市电力公司培训中心 , 国网天津市电力公司 , 国家电网有限公司
IPC: G06F40/295 , G06F40/284 , G06F18/241 , G06N3/0442 , G06N3/0464 , G06N3/048 , G06N3/08 , G06F16/33 , G06F16/35
Abstract: 本发明涉及文本识别技术领域,特别涉及电力审计文本实体识别方法、装置、设备及存储介质。本发明利用构造数据索引的方法制作词汇表,并通过word2vec将词汇表语义映射到实数向量。在BERT模型的基础上,提出了一种专用于电力审计系统的ASSPA模型结构,由改变预处理工作方式,有字向量、词向量、位置向量改编为卷积核特征提取,这样使文本块局部特征的提取更加全面。从实验结果看出,ASSPA模型对文本的实体识别有了一定程度的提升,精确率达到92.58%。
-
公开(公告)号:CN114417835B
公开(公告)日:2025-01-17
申请号:CN202111682324.4
申请日:2021-12-29
Applicant: 国网天津市电力公司 , 国家电网有限公司 , 国网天津市电力公司信息通信公司
IPC: G06F40/242 , G06F40/295 , G06F40/30 , G06F16/36 , G06N3/0442 , G06N3/045
Abstract: 本发明涉及一种基于深度学习算法的审计知识图谱实体抽取方法,包括以下步骤:步骤1、输入审计记录中审查过程描述文本序列;步骤2、基于步骤1输入审计记录中审查过程描述文本序列,生成融合审计词典知识的编码器,计算编码器输出特征向量;步骤3、利用单层LSTM网络对编码器输出的文本特征向量进行解码,得到包含实体潜藏关系的细粒度问题线索三元组序列。本发明针对审计过程详细情节,采用融合领域词典知识基于深度学习的问题线索三元组抽取细粒度实体关系联合抽取,更好利用了实体模型与关系模型交互与约束,实现结构化提取和存储审计事项,提升了对非结构化长文本实体关系抽取模型的性能。
-
公开(公告)号:CN116245107B
公开(公告)日:2023-08-04
申请号:CN202310532316.4
申请日:2023-05-12
Applicant: 国网天津市电力公司培训中心 , 国网天津市电力公司 , 国家电网有限公司
IPC: G06F40/295 , G06F40/284 , G06F18/241 , G06N3/0442 , G06N3/0464 , G06N3/048 , G06N3/08 , G06F16/33 , G06F16/35
Abstract: 本发明涉及文本识别技术领域,特别涉及电力审计文本实体识别方法、装置、设备及存储介质。本发明利用构造数据索引的方法制作词汇表,并通过word2vec将词汇表语义映射到实数向量。在BERT模型的基础上,提出了一种专用于电力审计系统的ASSPA模型结构,由改变预处理工作方式,有字向量、词向量、位置向量改编为卷积核特征提取,这样使文本块局部特征的提取更加全面。从实验结果看出,ASSPA模型对文本的实体识别有了一定程度的提升,精确率达到92.58%。
-
公开(公告)号:CN114417835A
公开(公告)日:2022-04-29
申请号:CN202111682324.4
申请日:2021-12-29
Applicant: 国网天津市电力公司 , 国家电网有限公司 , 国网天津市电力公司信息通信公司
IPC: G06F40/242 , G06F40/295 , G06F40/30 , G06F16/36 , G06N3/04
Abstract: 本发明涉及一种基于深度学习算法的审计知识图谱实体抽取方法,包括以下步骤:步骤1、输入审计记录中审查过程描述文本序列;步骤2、基于步骤1输入审计记录中审查过程描述文本序列,生成融合审计词典知识的编码器,计算编码器输出特征向量;步骤3、利用单层LSTM网络对编码器输出的文本特征向量进行解码,得到包含实体潜藏关系的细粒度问题线索三元组序列。本发明针对审计过程详细情节,采用融合领域词典知识基于深度学习的问题线索三元组抽取细粒度实体关系联合抽取,更好利用了实体模型与关系模型交互与约束,实现结构化提取和存储审计事项,提升了对非结构化长文本实体关系抽取模型的性能。
-
公开(公告)号:CN118093726B
公开(公告)日:2024-07-16
申请号:CN202410481077.9
申请日:2024-04-22
Applicant: 北京国电通网络技术有限公司 , 国家电网有限公司 , 国家电网有限公司大数据中心 , 国网天津市电力公司 , 国网信息通信产业集团有限公司 , 中国电力科学研究院有限公司
Abstract: 本发明公开了一种基于区域的数据库分库方法及装置,方法包括:确定待分库的单实例数据库中的公共数据表和业务数据表;分别在各个预设区域建立区域数据库;采集待分库的单实例数据库的历史操作信息;根据所述历史操作信息对所述业务数据表进行分表,获得各个区域的业务子表;将所述公共数据表全量迁移至各个区域数据库中,并将获得的各个区域的业务子表分别迁移至对应的区域数据库中;根据分表结果建立映射路由表并存储;该方法将数据按照区域划分存储,能够有效优化数据访问性能,特别适用于跨地域分布的大型在线服务系统。
-
-
-
-
-
-
-
-
-