一种稽查业务基础规则抽取方法及装置

    公开(公告)号:CN113901218A

    公开(公告)日:2022-01-07

    申请号:CN202111179406.7

    申请日:2021-10-08

    摘要: 本发明公开了一种稽查业务基础规则抽取方法及装置,构建一套电力稽查领域专业基础词典以及词向量生成模型,充分考虑了稽查领域的业务规则特点,以及字词间的重要性差异,通过将实体间关系转化为一种实体类别,不局限于已知的稽查业务关系,将关系作为一种实体从文本中直接提取出来。有效解决了稽查领域的业务规则抽取问题,而且充分考虑到文本语义信息以及字词间的重要性差异,通过一种将关系进行实体标签化、基于模式匹配的电力稽查业务规则三元组顺序抽取模型有效避免了传统关系抽取方法中分类模型必须将关系种类提前拟定的限制,提高了实体关系抽取的准确率。

    一种稽查新词识别系统及方法
    5.
    发明公开

    公开(公告)号:CN116882912A

    公开(公告)日:2023-10-13

    申请号:CN202310647462.1

    申请日:2023-06-01

    摘要: 本发明涉及电力稽查系统技术领域,具体为一种稽查新词识别系统及方法,一种稽查新词识别系统是由电力稽查系统、录入项识别系统、稽查录入系统组成,电力稽查系统的输出端与录入项识别系统、稽查录入系统的输入端通讯连接。本发明中,通过电力稽查系统的运作,进行不间断数据收录以及稽查工作,并分配巡检任务给稽查录入系统的各移动端口,以此录入关键内容,并在新词识别单元中,通过词汇录入单元搭载手动录入组件、导入组件、自动化生成组件,以此达成手动录入新词、通过文件导入新词以及基于关键内容自动化生成新词的效果,对同义词进行识别并比对参照的同时,也达成了新词的多维度识别功能,进而确保了数据录入工作的快捷性以及全面性特征。

    一种多标签稽查工单问题溯源识别方法及装置

    公开(公告)号:CN113868422A

    公开(公告)日:2021-12-31

    申请号:CN202111190115.8

    申请日:2021-10-11

    摘要: 本发明公开了一种多标签稽查工单问题溯源识别方法及装置,构建更加适用于电力行业的预训练语言模型,从专业维度识别并锁定海量电力稽查工单出现的问题共性原因,解决稽查业务中存在的风险及问题难以深度识别与分析的情况。在预训练语言模型构建过程中,除了选择非结构化的文本作为语料,还应加入行业专有词汇以及专有短语来增强预训练语言模型的“专业性”。基于大规模电力语料训练生成的词表文件,通过选择电力稽查行业非结构化的文本、行业专有词汇以及专有短语来作为语料,训练得到具有“专业性”增强效果的预训练模型,应用到下游特定的NLP任务中,从而突破下游任务性能瓶颈。

    一种针对中文文本的字符串匹配方法

    公开(公告)号:CN110955806B

    公开(公告)日:2022-11-18

    申请号:CN201911201503.4

    申请日:2019-11-29

    IPC分类号: G06F16/903

    摘要: 本发明涉及一种针对中文文本的字符串匹配方法。方法包括如下步骤:步骤1:根据报表属性定义关键词集;步骤2:以关键词询问的方式获取客户每个关键词下需要咨询的内容;步骤3:依次对每组字符串进行匹配;步骤4:查询每个关键词在报表中的位置;步骤5:判断关键词是否完全匹配,完全匹配则转步骤6,否则返回步骤4;步骤6:字符串进行模糊匹配;步骤7:判断是否可以完成该报表属性下各字符串匹配度计算;步骤8:判断所有字符串完成匹配;步骤9:计算字符串匹配度的最大值;步骤10:将该字符串对应的数据信息反馈给客户。本专利提高了信息查询的效率;提高了字符串匹配的准确性。

    一种针对中文文本的字符串匹配方法

    公开(公告)号:CN110955806A

    公开(公告)日:2020-04-03

    申请号:CN201911201503.4

    申请日:2019-11-29

    IPC分类号: G06F16/903

    摘要: 本发明涉及一种针对中文文本的字符串匹配方法。方法包括如下步骤:步骤1:根据报表属性定义关键词集;步骤2:以关键词询问的方式获取客户每个关键词下需要咨询的内容;步骤3:依次对每组字符串进行匹配;步骤4:查询每个关键词在报表中的位置;步骤5:判断关键词是否完全匹配,完全匹配则转步骤6,否则返回步骤4;步骤6:字符串进行模糊匹配;步骤7:判断是否可以完成该报表属性下各字符串匹配度计算;步骤8:判断所有字符串完成匹配;步骤9:计算字符串匹配度的最大值;步骤10:将该字符串对应的数据信息反馈给客户。本专利提高了信息查询的效率;提高了字符串匹配的准确性。