-
公开(公告)号:CN114462738B
公开(公告)日:2024-09-10
申请号:CN202011242141.6
申请日:2020-11-09
申请人: 中核核电运行管理有限公司
IPC分类号: G06Q10/0631 , G06Q10/0635 , G06Q50/06 , G06F16/9535 , G06F40/279 , G06F40/30
摘要: 本发明公开了核电厂工作许可证申请的经验反馈数据的智能推送方法,包括如下步骤,从核电厂工作任务准备系统、状态报告系统获取核电厂历史工作任务信息、历史许可证信息和历史状态报告信息;根据工作任务的作业特点,将工作任务分为需要一般许可证的工作和不需要一般许可证的任务;根据工作许可证的特点设计工作任务和状态报告的精准匹配规则和赋值原则;根据设计的匹配规则和赋值原则对历史工作任务信息和状态报告信息进行筛选和排序;工作任务准备人根据工作需要参考或直接引用推送的信息;工作任务准备人输入关键字主动搜索。其有益效果在于:可以快速定位经验反馈数据,减轻工作准备人员的时间和精力。
-
公开(公告)号:CN114168798A
公开(公告)日:2022-03-11
申请号:CN202111387757.7
申请日:2021-11-22
申请人: 中核核电运行管理有限公司
IPC分类号: G06F16/901 , G06F16/903 , G06F40/126
摘要: 本公开属于核电技术领域,具体涉及一种文本存储管理与检索方法及装置。本公开运用了分布式文档系统存储核电厂多堆型多类别海量非结构化文档以及对应的分析结果文档,并将文档存储地址作为文档映射存储在关系型数据库中,解决了海量非结构化文档存储问题,利用结果文档的分析结果,设计了基于跳表的分级索引、存储数据快照的四元组信息,使用TF‑IWF方法针对性的对核电厂多堆型多类别的非结构化文档设计了检索结果排序方式的重要指标,相比使用现有的检索引擎架构,本发明更具有轻型、快速以及针对性的优点,因而具有更强的实用性。
-
公开(公告)号:CN114386925B
公开(公告)日:2024-09-13
申请号:CN202111441609.9
申请日:2021-11-30
申请人: 中核核电运行管理有限公司
摘要: 本公开属于核电技术领域,具体涉及一种核电厂隔离冲突调解方法及装置。本公开的核电厂隔离冲突调解方法根据根据输入的安措隔离的数据,快速得到采取隔离措施的挂牌状态与待执行的安措隔离的挂牌状态冲突的隔离边界设备,并自动进行冲突指令调解,将隔离边界设备的挂牌状态修改为安措隔离要求的挂牌状态,实现了自动识别冲突,从而避免了人工手动查询行政隔离或运行隔离清单,减轻隔离经理工作负担,保证核电厂作业现场人员安全、设备安全和工作安全。
-
公开(公告)号:CN114169849B
公开(公告)日:2024-09-13
申请号:CN202111389650.6
申请日:2021-11-22
申请人: 中核核电运行管理有限公司
摘要: 本公开属于核电技术领域,具体涉及一种核电厂电子工作包执行方法及装置。本公开的方法包括接收登录账户对应的工单任务的电子工作包信息,所述电子工作包信息用于描述所述工单任务;在所述账户的用户界面中展示所述工单任务的电子工作包信息;在检测到所述用户界面展示的需要被确认的电子工作包信息被执行用于表示确认的触发操作的情况下,在所述用户界面展示用于描述所述工单任务被确认和/或执行的信息。避免了重复性数据登记输入,便于工作人员快速查找所需的参考文件、图纸、视频资料和提出工作指令、质量计划等修改申请,避免工作文件损坏遗失等问题。确保现场工作顺利执行,文件归档不受影响。
-
公开(公告)号:CN114168809B
公开(公告)日:2024-08-09
申请号:CN202111402289.6
申请日:2021-11-22
申请人: 中核核电运行管理有限公司
IPC分类号: G06F16/903 , G06F40/126
摘要: 本公开属于核电技术领域,具体涉及一种基于相似度的文档字符串编码匹配方法及装置。本公开中针对待匹配字符串,根据预设的编码规则生成待匹配字符串对应的正则表达式;针对目标文档,根据编码规则将目标文档的文本内容生成候选字符串集;将候选字符串集中的字符串与正则表达式进行匹配,保留与正则表达式匹配的字符串,滤除与正则表达式不匹配的字符串;采用SimHash算法分别生成保留的字符串以及候选字符串集中每个字符串的SimHash签名,确定保留的字符串的SimHash签名与候选字符串集中每个字符串的SimHash之间的汉明距离,输出汉明距离低于阈值的字符串及该字符串在目标文档中的位置。有效的提高了文档的解析效率,提高了编码模式匹配的速度。
-
公开(公告)号:CN114168808B
公开(公告)日:2024-08-09
申请号:CN202111387759.6
申请日:2021-11-22
申请人: 中核核电运行管理有限公司
IPC分类号: G06F16/903 , G06F40/126
摘要: 本公开属于核电技术领域,具体涉及一种基于正则表达式的文档字符串编码识别方法及装置。本公开根据正则表达式确定最佳因子集合;采用CW算法确定出现所述最佳因子集合中的最佳因子的文档记录,并将确定的文档记录添加到候选集合中;根据所述正则表达式确定的DFA自动机对候选集合中的最佳因子的字符串进行验证,将得到成功匹配的字符串。在查询正则表达式的时候定义了一个最佳因子,简化了使用正则表达式来查询的方式。根据最佳因子的个数选择CW算法对提取出来的最佳因子集合快速地查询,有效地过滤掉不包含最佳因子的字符串集合,得到候选字符串,并进一步使用DFA自动机对候选集中的字符串编码进行验证,从而提高整体的查询性能。
-
公开(公告)号:CN115982419A
公开(公告)日:2023-04-18
申请号:CN202111192690.1
申请日:2021-10-13
申请人: 中核核电运行管理有限公司
IPC分类号: G06F16/903 , G06F16/33 , G06F16/35 , G06N3/0442 , G06N3/045 , G06N3/08
摘要: 本发明涉及数据信息处理技术领域,具体公开了一种文档字符串内容识别方法。该方法包括:利用Bi‑LSTM‑CRF方法对字符串的编码规则进行分类,构建特定字符串识别模型;构建Bi‑LSTM‑CRF模型,利用特定场景中特定字符串作为字符串编码规则训练集,获得对字符串编码规则分类模型;将文档中的特定字符串与所述字符串编码规则分类模型进行匹配,获得特定字符串的匹配结果;将所述匹配结果与构建的所述特定字符串识别模型进行匹配识别后,生成编码结果集,并在原文档中标注编码。本方法能够在无先验精确编码规则知识前提下,依然能够有效准确识别特定字符串;相比现有的单纯利用字分布式字符串实体识别系统,基于Bi‑LSTM‑CRF模型的实体识别模型取得更好表现,具有更好的准确性。
-
公开(公告)号:CN115982344A
公开(公告)日:2023-04-18
申请号:CN202111192689.9
申请日:2021-10-13
申请人: 中核核电运行管理有限公司
IPC分类号: G06F16/35 , G06V10/762 , G06F18/23213 , G06F40/216
摘要: 本发明涉及文本数据挖掘技术领域,具体公开了一种文档自动聚类方法。该方法包括:采集待处理的文档,获取所述文档的文本数据,并进行分词和停用词过滤,获得文本集合特征词汇合集;利用TF‑IDF方法构建空间特征模型,对所述文本集合特征词汇合集进行处理,获得文本特征权重向量;利用改进差分进化算法,对所述文本特征权重向量进行选择和提取,并获得最优特征向量;利用最优特征向量进行聚类,并将所有文档聚类于所设定数目的簇中。本发明能够更好的发现文本集合内在的类别特性,用来发现无结构的文本集合中的“潜在概念”信息,这些信息有助于组织和搜索数量庞大的文档集合;此外本发明在文档处理过程中有效的减少人为的因素影响和人力资源的浪费。
-
公开(公告)号:CN114168809A
公开(公告)日:2022-03-11
申请号:CN202111402289.6
申请日:2021-11-22
申请人: 中核核电运行管理有限公司
IPC分类号: G06F16/903 , G06F40/126
摘要: 本公开属于核电技术领域,具体涉及一种基于相似度的文档字符串编码匹配方法及装置。本公开中针对待匹配字符串,根据预设的编码规则生成待匹配字符串对应的正则表达式;针对目标文档,根据编码规则将目标文档的文本内容生成候选字符串集;将候选字符串集中的字符串与正则表达式进行匹配,保留与正则表达式匹配的字符串,滤除与正则表达式不匹配的字符串;采用SimHash算法分别生成保留的字符串以及候选字符串集中每个字符串的SimHash签名,确定保留的字符串的SimHash签名与候选字符串集中每个字符串的SimHash之间的汉明距离,输出汉明距离低于阈值的字符串及该字符串在目标文档中的位置。有效的提高了文档的解析效率,提高了编码模式匹配的速度。
-
公开(公告)号:CN115964457A
公开(公告)日:2023-04-14
申请号:CN202111192730.2
申请日:2021-10-13
申请人: 中核核电运行管理有限公司
IPC分类号: G06F16/33 , G06F16/35 , G06F16/903
摘要: 本发明涉及数据处理技术领域,具体公开了一种文档字符串编码模糊匹配方法。该方法包括:构建带有标签的字符串编码信息库;获取文档字符串编码信息,对其进行预处理和特征选择,形成特征集合;对所述特征集合中的特征项进行特征提取,构建编码向量;构建支持向量机分类器,通过所述编码向量对支持向量机进行训练并获得文档编码的分类结果标签;对文档字符串进行模糊匹配时,对所查询的字符串进行划分并添加索引;在字符串编码查询时,进行字符串编码长度过滤及匹配过滤,将所述字符串添加到结果合集中。该方法能够提高文本分类效率和分类准确精度,且能够反映不同长度段落对匹配结果不影响的差异,同时编辑距离验证操作次数较少。
-
-
-
-
-
-
-
-
-