一种稽查新词识别系统及方法
    1.
    发明公开

    公开(公告)号:CN116882912A

    公开(公告)日:2023-10-13

    申请号:CN202310647462.1

    申请日:2023-06-01

    摘要: 本发明涉及电力稽查系统技术领域,具体为一种稽查新词识别系统及方法,一种稽查新词识别系统是由电力稽查系统、录入项识别系统、稽查录入系统组成,电力稽查系统的输出端与录入项识别系统、稽查录入系统的输入端通讯连接。本发明中,通过电力稽查系统的运作,进行不间断数据收录以及稽查工作,并分配巡检任务给稽查录入系统的各移动端口,以此录入关键内容,并在新词识别单元中,通过词汇录入单元搭载手动录入组件、导入组件、自动化生成组件,以此达成手动录入新词、通过文件导入新词以及基于关键内容自动化生成新词的效果,对同义词进行识别并比对参照的同时,也达成了新词的多维度识别功能,进而确保了数据录入工作的快捷性以及全面性特征。

    一种稽查业务基础规则抽取方法及装置

    公开(公告)号:CN113901218A

    公开(公告)日:2022-01-07

    申请号:CN202111179406.7

    申请日:2021-10-08

    摘要: 本发明公开了一种稽查业务基础规则抽取方法及装置,构建一套电力稽查领域专业基础词典以及词向量生成模型,充分考虑了稽查领域的业务规则特点,以及字词间的重要性差异,通过将实体间关系转化为一种实体类别,不局限于已知的稽查业务关系,将关系作为一种实体从文本中直接提取出来。有效解决了稽查领域的业务规则抽取问题,而且充分考虑到文本语义信息以及字词间的重要性差异,通过一种将关系进行实体标签化、基于模式匹配的电力稽查业务规则三元组顺序抽取模型有效避免了传统关系抽取方法中分类模型必须将关系种类提前拟定的限制,提高了实体关系抽取的准确率。

    一种多标签稽查工单问题溯源识别方法及装置

    公开(公告)号:CN113868422A

    公开(公告)日:2021-12-31

    申请号:CN202111190115.8

    申请日:2021-10-11

    摘要: 本发明公开了一种多标签稽查工单问题溯源识别方法及装置,构建更加适用于电力行业的预训练语言模型,从专业维度识别并锁定海量电力稽查工单出现的问题共性原因,解决稽查业务中存在的风险及问题难以深度识别与分析的情况。在预训练语言模型构建过程中,除了选择非结构化的文本作为语料,还应加入行业专有词汇以及专有短语来增强预训练语言模型的“专业性”。基于大规模电力语料训练生成的词表文件,通过选择电力稽查行业非结构化的文本、行业专有词汇以及专有短语来作为语料,训练得到具有“专业性”增强效果的预训练模型,应用到下游特定的NLP任务中,从而突破下游任务性能瓶颈。

    一种基于文本相似度度量的供电服务客户诉求识别方法

    公开(公告)号:CN109726283A

    公开(公告)日:2019-05-07

    申请号:CN201811463322.4

    申请日:2018-12-03

    摘要: 本发明涉及一种基于文本相似度度量的供电服务客户诉求识别方法。识别方法过程如下:建立客户诉求热点体系表;文本预处理:将工单中的文本进行文本分词及文本量化,对文本长内容进行切分,剔除停用词;停用词是指对文本分析无影响的语气助词、量大且无效的词汇、标点符号;自动化文本分类:最后根据识别的主题及对应的词库,结合分类算法对全量客服工单实现自动化的分类。本发明的优点在于:余弦相似度对于文本中多个主题可以自动准确的识别,故本发明创新性的将文本相似度度量与工单数据进行结合,精准识别每条工单中客户的全部诉求。