-
公开(公告)号:CN112257416A
公开(公告)日:2021-01-22
申请号:CN202011175920.9
申请日:2020-10-28
申请人: 国家电网有限公司客户服务中心 , 北京数洋智慧科技有限公司
IPC分类号: G06F40/216 , G06F40/284 , G06F40/289
摘要: 本发明涉及一种稽查新词发现方法,所述方法包括:首先用n‑gram算法模型进行分词,根据阈值过滤掉词频较小的候选词;然后计算候选词的互信息和左右邻接熵,提取候选词词性组合特征,并选用随机森林算法构建模型对特征指标进行训练测试,确保新词的准确性;最后在词性过滤之后,引入bloom filter算法提高匹配效率,最终输出新词发现模型结果。本发明提供的方案,可以帮助分析人员快速、准确发现稽查工单中出现的新词,构建稽查全专业基础词库,支撑工单文本分类识别,提高中心稽查工单分析能力。
-
公开(公告)号:CN113901218A
公开(公告)日:2022-01-07
申请号:CN202111179406.7
申请日:2021-10-08
申请人: 国家电网有限公司客户服务中心
IPC分类号: G06F16/35 , G06F40/289 , G06F40/242 , G06F40/216 , G06Q50/06
摘要: 本发明公开了一种稽查业务基础规则抽取方法及装置,构建一套电力稽查领域专业基础词典以及词向量生成模型,充分考虑了稽查领域的业务规则特点,以及字词间的重要性差异,通过将实体间关系转化为一种实体类别,不局限于已知的稽查业务关系,将关系作为一种实体从文本中直接提取出来。有效解决了稽查领域的业务规则抽取问题,而且充分考虑到文本语义信息以及字词间的重要性差异,通过一种将关系进行实体标签化、基于模式匹配的电力稽查业务规则三元组顺序抽取模型有效避免了传统关系抽取方法中分类模型必须将关系种类提前拟定的限制,提高了实体关系抽取的准确率。
-
公开(公告)号:CN111489743B
公开(公告)日:2024-06-25
申请号:CN201910082514.9
申请日:2019-01-28
申请人: 国家电网有限公司客户服务中心 , 北京中电普华信息技术有限公司
摘要: 本发明提供了一种基于智能语音技术的运营管理分析系统,包括:录音获取单元,用于从电话录音平台下载录音数据文件,进行文件拼接、转换,生成完整的语音文件;场景分割单元,用于将所述语音文件进行场景分割或话者分割;语音转写单元,基于智能语音识别引擎对所述语音文件进行识别并转写为文本内容;数据分析单元,基于神经网络模型对所述文本内容和语音文件进行分析,并输出分析报告;数据库单元,用于存储所述语音文件、文本内容和分析报告;内容索引单元,根据索引命令对数据库内存储的数据进行检索。本发明通过对呼叫中心的大量录音数据文件进行智能化分析,发现服务过程中的问题和不足,并及时掌握用户的诉求,从而提升用户满意度。
-
公开(公告)号:CN117251781A
公开(公告)日:2023-12-19
申请号:CN202311182543.5
申请日:2023-09-13
申请人: 国家电网有限公司客户服务中心
IPC分类号: G06F18/241 , G06F18/213 , G06F17/16 , G06F18/25 , G06N3/04 , G06Q50/06
摘要: 本申请公开了一种基于数据分析的电力稽查方法、装置以及存储介质。其中,一种基于数据分析的电力稽查方法,包括:获取用户的历史用电信息以及历史环境信息;根据历史用电信息以及历史环境信息,按照对一整日进行划分的多个时段,生成与用户对应的用电多维矩阵;利用预先设置的多个不同尺度的滑动窗分别按照时间顺序在用电多维矩阵上进行滑动,并且对滑动窗在各个滑动窗位置所限定的数据进行特征提取,生成与每个滑动窗位置对应的用电数据特征;根据用电数据特征,确定存在用电异常的滑动窗异常位置;以及根据与滑动窗异常位置对应的用电数据特征,确定与滑动窗异常位置对应的用电异常信息。
-
公开(公告)号:CN116882912A
公开(公告)日:2023-10-13
申请号:CN202310647462.1
申请日:2023-06-01
申请人: 国家电网有限公司客户服务中心
IPC分类号: G06Q10/10 , G06Q50/06 , G06F40/284 , G06F40/186 , G06F40/247
摘要: 本发明涉及电力稽查系统技术领域,具体为一种稽查新词识别系统及方法,一种稽查新词识别系统是由电力稽查系统、录入项识别系统、稽查录入系统组成,电力稽查系统的输出端与录入项识别系统、稽查录入系统的输入端通讯连接。本发明中,通过电力稽查系统的运作,进行不间断数据收录以及稽查工作,并分配巡检任务给稽查录入系统的各移动端口,以此录入关键内容,并在新词识别单元中,通过词汇录入单元搭载手动录入组件、导入组件、自动化生成组件,以此达成手动录入新词、通过文件导入新词以及基于关键内容自动化生成新词的效果,对同义词进行识别并比对参照的同时,也达成了新词的多维度识别功能,进而确保了数据录入工作的快捷性以及全面性特征。
-
公开(公告)号:CN114840509B
公开(公告)日:2024-07-09
申请号:CN202210485369.0
申请日:2022-05-06
申请人: 国家电网有限公司客户服务中心
IPC分类号: G06F16/215 , G06F16/2452 , G06F16/2458 , G06F16/28 , G06F18/2415 , G06N7/01
摘要: 本发明涉及大数据处理技术领域,具体涉及一种基于智能过滤的电力数据关联查询的方法及装置。一种基于智能过滤的电力数据关联查询的方法,包括如下步骤:样本数据输入,形成待关联查询的样本训练集;样本数据清洗;特征参数提取;构建过滤策略组合库;过滤策略实施;精准匹配;本发明一是解决亿级以上电力数据关联匹配计算量大,时效性差的问题,大幅提升非结构化数据匹配的质量和效率;二是针对不同类型数据能够产生优化的过滤组合,避免单一过滤策略无法有效剔除非匹配数据的问题,提升过滤策略对异构电力数据的适配性;三是构建了可操作的关联匹配评价算法,从匹配质量和计算效率两个角度去评估过滤方法,具备工程实用价值。
-
公开(公告)号:CN113868422A
公开(公告)日:2021-12-31
申请号:CN202111190115.8
申请日:2021-10-11
申请人: 国家电网有限公司客户服务中心
IPC分类号: G06F16/35 , G06F40/211 , G06F40/289 , G06N3/04 , G06N3/08 , G06Q50/06
摘要: 本发明公开了一种多标签稽查工单问题溯源识别方法及装置,构建更加适用于电力行业的预训练语言模型,从专业维度识别并锁定海量电力稽查工单出现的问题共性原因,解决稽查业务中存在的风险及问题难以深度识别与分析的情况。在预训练语言模型构建过程中,除了选择非结构化的文本作为语料,还应加入行业专有词汇以及专有短语来增强预训练语言模型的“专业性”。基于大规模电力语料训练生成的词表文件,通过选择电力稽查行业非结构化的文本、行业专有词汇以及专有短语来作为语料,训练得到具有“专业性”增强效果的预训练模型,应用到下游特定的NLP任务中,从而突破下游任务性能瓶颈。
-
公开(公告)号:CN111489743A
公开(公告)日:2020-08-04
申请号:CN201910082514.9
申请日:2019-01-28
申请人: 国家电网有限公司客户服务中心 , 北京中电普华信息技术有限公司
摘要: 本发明提供了一种基于智能语音技术的运营管理分析系统,包括:录音获取单元,用于从电话录音平台下载录音数据文件,进行文件拼接、转换,生成完整的语音文件;场景分割单元,用于将所述语音文件进行场景分割或话者分割;语音转写单元,基于智能语音识别引擎对所述语音文件进行识别并转写为文本内容;数据分析单元,基于神经网络模型对所述文本内容和语音文件进行分析,并输出分析报告;数据库单元,用于存储所述语音文件、文本内容和分析报告;内容索引单元,根据索引命令对数据库内存储的数据进行检索。本发明通过对呼叫中心的大量录音数据文件进行智能化分析,发现服务过程中的问题和不足,并及时掌握用户的诉求,从而提升用户满意度。
-
公开(公告)号:CN110955806B
公开(公告)日:2022-11-18
申请号:CN201911201503.4
申请日:2019-11-29
申请人: 国家电网有限公司客户服务中心
IPC分类号: G06F16/903
摘要: 本发明涉及一种针对中文文本的字符串匹配方法。方法包括如下步骤:步骤1:根据报表属性定义关键词集;步骤2:以关键词询问的方式获取客户每个关键词下需要咨询的内容;步骤3:依次对每组字符串进行匹配;步骤4:查询每个关键词在报表中的位置;步骤5:判断关键词是否完全匹配,完全匹配则转步骤6,否则返回步骤4;步骤6:字符串进行模糊匹配;步骤7:判断是否可以完成该报表属性下各字符串匹配度计算;步骤8:判断所有字符串完成匹配;步骤9:计算字符串匹配度的最大值;步骤10:将该字符串对应的数据信息反馈给客户。本专利提高了信息查询的效率;提高了字符串匹配的准确性。
-
公开(公告)号:CN110955806A
公开(公告)日:2020-04-03
申请号:CN201911201503.4
申请日:2019-11-29
申请人: 国家电网有限公司客户服务中心
IPC分类号: G06F16/903
摘要: 本发明涉及一种针对中文文本的字符串匹配方法。方法包括如下步骤:步骤1:根据报表属性定义关键词集;步骤2:以关键词询问的方式获取客户每个关键词下需要咨询的内容;步骤3:依次对每组字符串进行匹配;步骤4:查询每个关键词在报表中的位置;步骤5:判断关键词是否完全匹配,完全匹配则转步骤6,否则返回步骤4;步骤6:字符串进行模糊匹配;步骤7:判断是否可以完成该报表属性下各字符串匹配度计算;步骤8:判断所有字符串完成匹配;步骤9:计算字符串匹配度的最大值;步骤10:将该字符串对应的数据信息反馈给客户。本专利提高了信息查询的效率;提高了字符串匹配的准确性。
-
-
-
-
-
-
-
-
-