-
公开(公告)号:CN113065352B
公开(公告)日:2022-07-19
申请号:CN202010607534.6
申请日:2020-06-29
申请人: 国网浙江省电力有限公司杭州供电公司
IPC分类号: G06F40/289 , G06F40/253 , G06F40/30 , G06F40/166 , G06F16/903 , G06K9/62 , G06N3/04 , G06N3/08
摘要: 本申请提出了一种电网调度工作文本的操作内容识别方法,包括将电网调度工作文本进行分词处理,对得到的词组进行向量重组操作;将向量重组后的词组输出至基于双向LSTM和CNN的深度学习网络,得到词组对应电网调度工作文本的概率值;选取最大概率值对应的电网调度工作文本进行基于编辑距离的模糊匹配计算,基于计算结果确定深度学习网络输出的词组对应的具体操作类型;对已确定的具体操作类型进行基于字符串匹配的运算得到处理详情。通过采用了深度学习网络,避免其他信息对操作内容信息的干扰;另外引入基于编辑距离和字符串匹配结合的规则对分句中的关键信息进行识别,提高了电网调度工作文本中的操作设备类型和操作类型信息的识别准确率。
-
公开(公告)号:CN111489746B
公开(公告)日:2022-07-26
申请号:CN202010148584.2
申请日:2020-03-05
申请人: 国网浙江省电力有限公司 , 国网浙江省电力有限公司杭州供电公司
发明人: 陈蕾 , 郑伟彦 , 杨勇 , 黄武浩 , 张弛 , 乐全明 , 童力 , 陈彤 , 黄红兵 , 章毅 , 刘宏伟 , 姜健 , 余慧华 , 傅婧 , 郑洁 , 曹青 , 向新宇 , 卢家驹 , 何岳昊
IPC分类号: G10L15/18 , G10L15/02 , G10L15/06 , G10L15/26 , G10L15/183
摘要: 本发明涉及电网调度语音识别领域,尤其涉及一种基于BERT的电网调度语音识别语言模型构建方法,包括:提取电网调度语句的字粒度语义特征;提取电网调度语句的关键字特征;提取电网调度语句的命名实体特征;对输入BERT原始模型的电网调度语句以字为单元进行切分以提取位置特征,基于语义特征、关键字特征、命名实体特征以及位置特征对BERT原始模型进行训练得到电网调度语音识别语言模型。本发明的有益效果:根据电网调度语言特点和调度语音识别应用场景,对BERT模型的调度语句输入特征向量和输出概率预测方法进行改进,实现结合调度语言特征的电网调度语句合理性判断,且相比于其他常用的语言模型在电网调度语音识别方面有更高的准确性。
-
公开(公告)号:CN111475655B
公开(公告)日:2022-09-20
申请号:CN202010148583.8
申请日:2020-03-05
申请人: 国网浙江省电力有限公司 , 国网浙江省电力有限公司杭州供电公司
发明人: 郑伟彦 , 陈蕾 , 杨勇 , 黄武浩 , 张弛 , 乐全明 , 童力 , 陈彤 , 黄红兵 , 章毅 , 刘宏伟 , 姜健 , 余慧华 , 傅婧 , 郑洁 , 曹青 , 向新宇 , 卢家驹 , 龚成尧
IPC分类号: G06F16/36 , G06F16/33 , G06F16/35 , G06F40/295 , G06F40/30
摘要: 本发明涉及电力领域,尤其涉及一种基于配电网知识图谱的电力调度文本实体链接方法,包括:构建配电网知识图谱;提取电力调度文本的语义特征;提取电力调度文本的发音特征;提取电力调度文本的词性特征;基于电力调度文本的语义特征、发音特征以及词性特征,构建电力调度信息匹配模型;利用所述电力调度信息匹配模型,将电力调度文本与配电网知识图谱中的所有实体依次进行匹配,从而完成面向配电网知识图谱的电力调度文本的实体链接。本发明对电力调度文本和知识图谱实体进行多维度特征提取,并构建电力调度信息匹配模型进行电力调度文本和知识图谱实体的匹配,从而提高电力调度文本实体链接的准确率。
-
公开(公告)号:CN113065352A
公开(公告)日:2021-07-02
申请号:CN202010607534.6
申请日:2020-06-29
申请人: 国网浙江省电力有限公司杭州供电公司
IPC分类号: G06F40/289 , G06F40/253 , G06F40/30 , G06F40/166 , G06F16/903 , G06K9/62 , G06N3/04 , G06N3/08
摘要: 本申请提出了一种电网调度工作文本的操作内容识别方法,包括将电网调度工作文本进行分词处理,对得到的词组进行向量重组操作;将向量重组后的词组输出至基于双向LSTM和CNN的深度学习网络,得到词组对应电网调度工作文本的概率值;选取最大概率值对应的电网调度工作文本进行基于编辑距离的模糊匹配计算,基于计算结果确定深度学习网络输出的词组对应的具体操作类型;对已确定的具体操作类型进行基于字符串匹配的运算得到处理详情。通过采用了深度学习网络,避免其他信息对操作内容信息的干扰;另外引入基于编辑距离和字符串匹配结合的规则对分句中的关键信息进行识别,提高了电网调度工作文本中的操作设备类型和操作类型信息的识别准确率。
-
公开(公告)号:CN111489746A
公开(公告)日:2020-08-04
申请号:CN202010148584.2
申请日:2020-03-05
申请人: 国网浙江省电力有限公司 , 国网浙江省电力有限公司杭州供电公司
发明人: 陈蕾 , 郑伟彦 , 杨勇 , 黄武浩 , 张弛 , 乐全明 , 童力 , 陈彤 , 黄红兵 , 章毅 , 刘宏伟 , 姜健 , 余慧华 , 傅婧 , 郑洁 , 曹青 , 向新宇 , 卢家驹 , 何岳昊
IPC分类号: G10L15/18 , G10L15/02 , G10L15/06 , G10L15/26 , G10L15/183
摘要: 本发明涉及电网调度语音识别领域,尤其涉及一种基于BERT的电网调度语音识别语言模型构建方法,包括:提取电网调度语句的字粒度语义特征;提取电网调度语句的关键字特征;提取电网调度语句的命名实体特征;对输入BERT原始模型的电网调度语句以字为单元进行切分以提取位置特征,基于语义特征、关键字特征、命名实体特征以及位置特征对BERT原始模型进行训练得到电网调度语音识别语言模型。本发明的有益效果:根据电网调度语言特点和调度语音识别应用场景,对BERT模型的调度语句输入特征向量和输出概率预测方法进行改进,实现结合调度语言特征的电网调度语句合理性判断,且相比于其他常用的语言模型在电网调度语音识别方面有更高的准确性。
-
公开(公告)号:CN111475655A
公开(公告)日:2020-07-31
申请号:CN202010148583.8
申请日:2020-03-05
申请人: 国网浙江省电力有限公司 , 国网浙江省电力有限公司杭州供电公司
发明人: 郑伟彦 , 陈蕾 , 杨勇 , 黄武浩 , 张弛 , 乐全明 , 童力 , 陈彤 , 黄红兵 , 章毅 , 刘宏伟 , 姜健 , 余慧华 , 傅婧 , 郑洁 , 曹青 , 向新宇 , 卢家驹 , 龚成尧
IPC分类号: G06F16/36 , G06F16/33 , G06F16/35 , G06F40/295 , G06F40/30
摘要: 本发明涉及电力领域,尤其涉及一种基于配电网知识图谱的电力调度文本实体链接方法,包括:构建配电网知识图谱;提取电力调度文本的语义特征;提取电力调度文本的发音特征;提取电力调度文本的词性特征;基于电力调度文本的语义特征、发音特征以及词性特征,构建电力调度信息匹配模型;利用所述电力调度信息匹配模型,将电力调度文本与配电网知识图谱中的所有实体依次进行匹配,从而完成面向配电网知识图谱的电力调度文本的实体链接。本发明对电力调度文本和知识图谱实体进行多维度特征提取,并构建电力调度信息匹配模型进行电力调度文本和知识图谱实体的匹配,从而提高电力调度文本实体链接的准确率。
-
-
-
-
-