-
公开(公告)号:CN118964695A
公开(公告)日:2024-11-15
申请号:CN202411466691.4
申请日:2024-10-21
申请人: 国网信通亿力科技有限责任公司
IPC分类号: G06F16/9032 , G06F16/901 , G06F16/9038 , G06F16/28 , G06F40/216 , G06F40/289 , G06N3/045 , G06N3/0499 , G06N3/0464
摘要: 本发明涉及一种基于文本向量化的电力系统向量知识库构建方法,包括以下步骤:步骤S1:获取电力系统向量知识库构建相关的数据原始文本和元数据,并预处理;步骤S2:通过稀疏向量和稠密向量组合的方法,进行文本向量化;步骤S3:将原始文本和元数据存储在关系数据库中,向量数据存储在NoSQL向量数据库中,并构建关联关系;步骤S4:用户输入查询时,对查询向量进行优化处理,改进查询算法和优化查询流程,引入多阶段筛选机制,获取初步检索结果;步骤S5:基于增强召回的策略,使用领域特定的信息和规则对初步检索结果进行重新排序,得到最终的检索结果。本发明能够有效提高电力系统知识库的构建效率和使用效果。
-
公开(公告)号:CN116662472A
公开(公告)日:2023-08-29
申请号:CN202310695623.4
申请日:2023-06-13
申请人: 国网信通亿力科技有限责任公司
IPC分类号: G06F16/29 , G06F16/31 , G06F17/16 , G06N3/082 , G06F40/289 , G06F40/295 , G06F16/35 , G06N3/045 , G06F18/2415
摘要: 本发明涉及深度学习技术领域,公开了一种基于非结构化地址数据构建结构化地址库的方法,包括以下步骤:构建初始地址树;从地址文本中提取地址要素;地址要素映射初始地址树;构建并训练地址要素纠错模型;使用地址要素纠错模型,并对地址要素进行纠错;对初始地址树进行剪枝获得最终地址树;本发明通过提取非结构化的地址文本中的地址要素,并通过神经网络模型对地址要素进行自动纠错,将非结构化的地址文本构建成结构化的地址树。
-
公开(公告)号:CN116842015A
公开(公告)日:2023-10-03
申请号:CN202310806125.2
申请日:2023-07-03
申请人: 国网信通亿力科技有限责任公司
IPC分类号: G06F16/22 , G06F16/23 , G06F16/2458 , G06N3/042
摘要: 本发明涉及数据库技术领域,公开了一种页面与表关系的溯源方法,包括以下步骤:101,登录业务系统之后对分析页面渲染之后的html字段和响应返回的json数据进行获取;102,删除重复的html字段获得html待匹配字段;103,删除json数据中的非对象结构和单行json,对json数据中的响应数据进行聚类,为每个聚类簇内的响应数据生成一个json聚类结果集;104,为每个json聚类结果集生成一个待匹配字段序列;105,通过最大公共子序列算法为每个待匹配字段序列匹配数据库表;本发明能够基于业务人员对页面的访问来对数据库表与页面进行溯源,业务人员能够基于溯源的结果了解数据库表的内容和与页面逻辑关系,便于与开发人员进行沟通。
-
公开(公告)号:CN115618883A
公开(公告)日:2023-01-17
申请号:CN202211428321.2
申请日:2022-11-15
申请人: 国网信通亿力科技有限责任公司
IPC分类号: G06F40/30 , G06F40/289
摘要: 本发明涉及一种业务语义识别方法,包括以下步骤:步骤S1:接收待识别语义的英文字符串及其他上下文信息;步骤S2:对待识别字段进行预处理;步骤S3:切分待识别字段,得到若干种分词方案;步骤S4:对每个分词方案,使用转移概率矩阵计算词切分点处的概率得分;步骤S5:对方案中的每个词,通过拼音语义DFA树判断为非拼音,则与词库中的词条进行逐个匹配,并计算相似得分;步骤S6:取相似得分最高的词条的语义,计算整个匹配方案语义间的关联得分;步骤S7:提取综合得分最高的匹配方案,拼接作为推荐标注;步骤S8:输出推荐的中文业务语义及推荐指标等相关信息。本发明提升元数据梳理工作的效率。
-
-
-