-
公开(公告)号:CN111325019A
公开(公告)日:2020-06-23
申请号:CN202010072472.3
申请日:2020-01-21
申请人: 国网北京市电力公司 , 国家电网有限公司 , 福建亿榕信息技术有限公司
IPC分类号: G06F40/242 , G06F40/109 , G06F16/332
摘要: 本发明公开了一种词库的更新方法及装置、电子设备。其中,该方法包括:获取审计新语料,其中,审计新语料中包括:审计基础词和电力资料语句;对审计新语料进行标注处理,得到基础样本数据;采用新词检索模型识别基础样本数据中的新词,其中,新词检索模型是基于多组数据训练得到的,多组数据中的每组数据包括:词库词语和新词预测概率;基于新词更新审计资料词库。本发明解决了相关技术中提取语料时容易遗漏专业术语,导致术语资料库的数据质量不均衡、数据不全面的技术问题。
-
公开(公告)号:CN112632985A
公开(公告)日:2021-04-09
申请号:CN202011507899.8
申请日:2020-12-18
申请人: 国网北京市电力公司 , 国家电网有限公司 , 福建亿榕信息技术有限公司
IPC分类号: G06F40/289 , G06N3/04 , G06N3/08
摘要: 本发明公开了一种语料的处理方法、装置、存储介质及处理器。其中,该方法包括:获取待识别的词句;采用新词发现模型处理词句,识别出至少一个候选语料,其中,新词发现模型为采用深度学习模型训练得到的语料模型;从至少一个候选语料中确定目标语料,其中,目标语料为从词句中识别出来的新词汇。本发明解决了现有技术中获取术语过程效率低的技术问题。
-
公开(公告)号:CN113792151A
公开(公告)日:2021-12-14
申请号:CN202110951988.X
申请日:2021-08-18
申请人: 国家电网有限公司 , 国家电网有限公司大数据中心 , 国网天津市电力公司 , 国网信息通信产业集团有限公司 , 福建亿榕信息技术有限公司
IPC分类号: G06F16/36 , G06F16/33 , G06F16/335 , G06F16/338 , G06F16/903
摘要: 本发明涉及一种面向多数据源审计知识图谱的智能检索方法,包括以下步骤:步骤1、对用户的查询请求进行字符串的预处理,并按序查询同构子图,并将所查询到的同构子图加入一次查询候选结果集中;步骤2、对步骤1的一次查询候选结果进行评估;步骤3、将步骤2评估后的一次查询候选结果进行融合;步骤4、对步骤3融合后的查询结果进行二次查询。本发明能够既考虑实体知识表达的多样性和关联性,又不增加知识图谱的维护成本的情况下,从多个数据源的审计知识图谱中,有效获取查询结果。
-
公开(公告)号:CN113535818A
公开(公告)日:2021-10-22
申请号:CN202110801307.1
申请日:2021-07-15
申请人: 福建亿榕信息技术有限公司 , 国网信息通信产业集团有限公司 , 国网上海市电力公司 , 国家电网有限公司大数据中心 , 国家电网有限公司
IPC分类号: G06F16/2458 , G06F16/25 , G06N5/02 , G06N3/04
摘要: 本发明涉及一种构建审计综合知识库的方法,包括如下步骤:S1、获取审计数据,所述审计数据包括审计对象数据、审计依据数据、审计结果数据;S2、对审计数据进行预处理:对于审计对象数据和审计结果数据,将其中的非结构化数据转换为结构化数据;对于审计依据数据,通过篇章结构提取技术进行条款化拆分;S3、对预处理后的审计数据进行数据挖掘;S4、建立综合知识库,综合知识库包含多个知识库;将数据挖掘后的审计数据按类别存储在所述多个知识库中。
-
公开(公告)号:CN113849659A
公开(公告)日:2021-12-28
申请号:CN202110952014.3
申请日:2021-08-18
申请人: 国网天津市电力公司 , 国家电网有限公司 , 国网信息通信产业集团有限公司 , 福建亿榕信息技术有限公司
摘要: 本发明涉及一种审计制度时序知识图谱的构建方法,包括以下步骤:步骤1、构建审计制度本体;步骤2、提取步骤1所构建的审计制度的本体中的实体知识;步骤3、对步骤2所抽取的审计制度实体知识进行知识融合;步骤4、对步骤3审计制度实体知识融合后的结果进行知识优化;步骤5、依据步骤4审计制度实体知识优化后的结果,构建审计制度知识图谱;步骤6、依据步骤1所构建的审计制度本体,从审计制度库文档中提取实体时序知识;步骤7、构建审计制度时序知识图谱。本发明能够将实体的时序信息融合到实体知识中。
-
公开(公告)号:CN113536372B
公开(公告)日:2023-06-13
申请号:CN202110769184.8
申请日:2021-07-07
申请人: 国网上海市电力公司 , 国家电网有限公司 , 国家电网有限公司大数据中心 , 国网信息通信产业集团有限公司
IPC分类号: G06F21/62
摘要: 本申请公开了一种数据处理方法及装置,方法应用于审计服务器,所述审计服务器中构建有可信执行环境,所述方法包括:获得审计请求,所述审计请求中至少包含审计任务标识;根据所述审计任务标识,生成审计通知消息;将所述审计通知消息发送给所述可信执行环境,以使得所述可信执行环境对所述审计任务标识对应的目标数据进行审计,以得到审计结果;其中,所述目标数据由数据服务器在对所述审计任务标识对应的用户数据进行加密处理得到并传输给所述可信执行环境。
-
公开(公告)号:CN115471307A
公开(公告)日:2022-12-13
申请号:CN202211225973.6
申请日:2022-10-09
申请人: 国家电网有限公司 , 国网冀北电力有限公司 , 国家电网有限公司大数据中心 , 北京国电通网络技术有限公司 , 国网信息通信产业集团有限公司
IPC分类号: G06Q40/00 , G06F16/36 , G06F40/279 , G06N3/04
摘要: 本公开的实施例公开了基于知识图谱的审计评估信息生成方法、装置和电子设备。该方法的一具体实施方式包括:获取目标审计报告文本;对目标审计报告文本进行文本清洗,以生成文本信息;生成文本信息对应的目标知识图谱;确定目标知识图谱对应的同构知识图谱,得到同构知识图谱集合;根据目标知识图谱、同构知识图谱集合和预先训练的质量评估模型,生成目标审计报告文本对应的审计评估信息;将审计评估信息发送至目标显示终端以供显示。该实施方式提高了审计效率和生成的审计评估信息的准确性。
-
公开(公告)号:CN115578063A
公开(公告)日:2023-01-06
申请号:CN202211236782.X
申请日:2022-10-10
申请人: 国家电网有限公司 , 国网安徽省电力有限公司 , 国家电网有限公司大数据中心 , 北京国网信通埃森哲信息技术有限公司
摘要: 本申请提供的基于知识图谱的审计报告生成方法及相关设备,基于预先构建的审计知识图谱以及审计知识库获取与当前审计项目关联的历史被审计单位的相关信息、审计底稿、审计问题及审计建议,生成当前审计项目的审计报告,实现对于审计报告的辅助写作,减少审计人员在重复性、规程性文字中的人力投入,增强数据可信度的同时节约审计成本。
-
公开(公告)号:CN114119058B
公开(公告)日:2023-09-26
申请号:CN202110915488.0
申请日:2021-08-10
申请人: 国家电网有限公司 , 国网内蒙古东部电力有限公司 , 国家电网有限公司大数据中心
IPC分类号: G06Q30/0201 , G06Q30/0203 , G06F18/23 , G06N20/00
摘要: 本发明公开了一种用户画像模型的构建方法、设备及存储介质,包括获取待分析用户的原始系统数据;基于原始系统数据构建用户特征数据集;对用户特征数据集进行特征提取得到用户特征数据子集;对用户特征数据子集进行特征筛选并确定其索引标签,生成用户画像数据集;基于机器学习技术对用户画像数据集进行训练;对训练数据进行归一化,并根据多类型的训练数据的权重值,对每一类型的训练数据的索引标签进行训练,得到用户画像模型。本发明通过在多个数据维度方面对特殊领域用户进行画像,构建可标签化的模型,使用户画像更具立体化,对于异构数据源可以快速形成智能画像生成模型,识别异常用户。
-
公开(公告)号:CN115481260A
公开(公告)日:2022-12-16
申请号:CN202211227641.1
申请日:2022-10-09
申请人: 国家电网有限公司 , 国网湖北省电力有限公司 , 国家电网有限公司大数据中心 , 北京国电通网络技术有限公司 , 国网信息通信产业集团有限公司
摘要: 本公开的实施例公开了基于审计信息的知识图谱构建方法、装置和电子设备。该方法的一具体实施方式包括:获取待审计文本信息;对待审计文本信息进行文本抽取处理,以生成文本信息集合,其中,文本信息集合中的文本信息包括目标数量个相邻的文本段;对文本信息集合中的每个文本信息进行实体和实体关系抽取,以生成实体对信息组,得到实体对信息组集合,其中,实体对信息组集合中的实体对信息组中的实体对信息包括:实体信息集合和关系信息;根据实体对信息组集合中的实体对信息包括的实体信息集合和关系信息,构建初始图谱网络;对初始图谱网络进行图谱网络优化,以生成目标知识图谱。该实施方式提高了存储空间的使用效率和知识图谱构建的准确率。
-
-
-
-
-
-
-
-
-