-
公开(公告)号:CN111611792B
公开(公告)日:2023-05-23
申请号:CN202010439068.5
申请日:2020-05-21
Applicant: 全球能源互联网研究院有限公司 , 国家电网有限公司 , 国家电网有限公司信息通信分公司 , 国网山东省电力公司信息通信公司
IPC: G06F40/232 , G06F40/295 , G10L15/26
Abstract: 本发明提供了一种语音转录文本的实体纠错方法及系统,该方法包括:对从目标语音转录文本中提取的实体词汇进行拼音标注;利用标注的拼音及基于拼音相似度的编辑距离对实体词汇进行聚类,生成聚类结果;将聚类结果中在同一类别出现频率最高的实体词汇确定为标准实体词汇,并将该类别中其他实体词汇替换为标准实体词汇。通过利用基于拼音相似度的编辑距离对实体词汇进行聚类,从而将拼音相似度作为参考因素加入编辑距离算法中,加强了对同义词及音词的辨别能力,使得聚类结果更加符合语音转录文本的实际情况,根据该聚类结果用同一类别中出现频率最高的实体词汇替换其他实体词汇,实现了对语音转录文本的纠错,进而提高了最终语音转录文本的准确性。
-
公开(公告)号:CN111651641B
公开(公告)日:2023-08-29
申请号:CN202010481878.7
申请日:2020-05-29
Applicant: 全球能源互联网研究院有限公司 , 国家电网有限公司 , 国家电网有限公司信息通信分公司 , 国网山东省电力公司
IPC: G06F16/901 , G06F16/9032 , G16H50/20
Abstract: 本发明提供一种图查询方法、装置及存储介质,其中,方法包括:获取待查询子图;根据所述待查询子图在原始图对应的摘要图中进行查询,得到目标查询子图,所述原始图表征包含待查询子图对应的图信息的图,所述原始图由边对具有属性关系的节点进行连接得到,所述原始图中的边标注有连接的两个节点间的属性关系,所述摘要图表征对所述原始图进行节点合并后的图;根据所述待查询子图和所述目标查询子图在得到所述目标查询子图的原始图中进行查询,得到图查询结果。通过实施本发明,可以更好地适应当前随着时代发展所带来的越来越大的图规模,并且查询效率高效,返回结果准确性高,能够满足在海量图数据中快速高效查询子图的要求。
-
公开(公告)号:CN111708745A
公开(公告)日:2020-09-25
申请号:CN202010562482.5
申请日:2020-06-18
Applicant: 全球能源互联网研究院有限公司 , 国家电网有限公司信息通信分公司 , 国家电网有限公司 , 国网山东省电力公司
IPC: G06F16/176 , G06F21/62 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明提供了一种跨媒体数据共享表示方法及用户行为分析方法、系统,该跨媒体数据共享表示方法包括:获取跨媒体数据,跨媒体数据包括图像和文本两种类型的媒体数据;使用多模式深度置信网络对跨媒体数据中每种媒体类型进行媒体间独立表征学习,得到每种媒体类型对应的媒体间独立表示;使用堆叠式自动编码器对跨媒体数据进行媒体内独立表征学习,得到每种媒体类型对应的媒体内独立表示;将每种媒体类型对应的媒体间独立表示和媒体内独立表示进行分层组合,得到跨媒体数据的共享表示。通过保留媒体间数据的关联信息,并学习跨媒体相关性来获得共享表示,可以捕获复杂的跨媒体相关性,使得该共享表示方法能够适用于复杂跨媒体数据的场景。
-
公开(公告)号:CN111708745B
公开(公告)日:2023-04-21
申请号:CN202010562482.5
申请日:2020-06-18
Applicant: 全球能源互联网研究院有限公司 , 国家电网有限公司信息通信分公司 , 国家电网有限公司 , 国网山东省电力公司
IPC: G06F16/176 , G06F21/62 , G06V10/762 , G06V10/82 , G06N3/044 , G06N3/047 , G06N3/0475 , G06N3/08
Abstract: 本发明提供了一种跨媒体数据共享表示方法及用户行为分析方法、系统,该跨媒体数据共享表示方法包括:获取跨媒体数据,跨媒体数据包括图像和文本两种类型的媒体数据;使用多模式深度置信网络对跨媒体数据中每种媒体类型进行媒体间独立表征学习,得到每种媒体类型对应的媒体间独立表示;使用堆叠式自动编码器对跨媒体数据进行媒体内独立表征学习,得到每种媒体类型对应的媒体内独立表示;将每种媒体类型对应的媒体间独立表示和媒体内独立表示进行分层组合,得到跨媒体数据的共享表示。通过保留媒体间数据的关联信息,并学习跨媒体相关性来获得共享表示,可以捕获复杂的跨媒体相关性,使得该共享表示方法能够适用于复杂跨媒体数据的场景。
-
公开(公告)号:CN111651641A
公开(公告)日:2020-09-11
申请号:CN202010481878.7
申请日:2020-05-29
Applicant: 全球能源互联网研究院有限公司 , 国家电网有限公司 , 国家电网有限公司信息通信分公司 , 国网山东省电力公司
IPC: G06F16/901 , G06F16/9032 , G16H50/20
Abstract: 本发明提供一种图查询方法、装置及存储介质,其中,方法包括:获取待查询子图;根据所述待查询子图在原始图对应的摘要图中进行查询,得到目标查询子图,所述原始图表征包含待查询子图对应的图信息的图,所述原始图由边对具有属性关系的节点进行连接得到,所述原始图中的边标注有连接的两个节点间的属性关系,所述摘要图表征对所述原始图进行节点合并后的图;根据所述待查询子图和所述目标查询子图在得到所述目标查询子图的原始图中进行查询,得到图查询结果。通过实施本发明,可以更好地适应当前随着时代发展所带来的越来越大的图规模,并且查询效率高效,返回结果准确性高,能够满足在海量图数据中快速高效查询子图的要求。
-
公开(公告)号:CN111553442B
公开(公告)日:2024-03-12
申请号:CN202010397834.6
申请日:2020-05-12
Applicant: 国网智能电网研究院有限公司 , 国家电网有限公司 , 国家电网有限公司信息通信分公司 , 国网山东省电力公司信息通信公司
IPC: G06F18/241 , G06F18/214
Abstract: 本发明公开了一种分类器链标签序列的优化方法及系统,方法包括:获取待分类的输入样本;利用分类器链模型识别输入样本,生成样本标签集合,组成分类器链;利用共现分析获取样本标签集合对应的共现矩阵;利用共现矩阵的多个共现分支组成共现向量;根据共现向量获取分类器链的起始分支,基于贪心策略生成分类器链标签的顺序。本发明提出了分类器链对应的标签顺序生成策略,通过加快算法生成标签序列,耗时少,得到的分类器链的标签序列准确率高,实现了对原有分类器链模型的性能优化。
-
公开(公告)号:CN110968692B
公开(公告)日:2023-04-07
申请号:CN201911010301.1
申请日:2019-10-23
Applicant: 全球能源互联网研究院有限公司 , 国网江苏省电力有限公司 , 国网江苏省电力有限公司电力科学研究院 , 国家电网有限公司
Abstract: 本发明公开了一种文本分类方法及系统,方法包括:获取待分类文本的父标签并转化为父标签词索引向量;将父标签词索引向量与文本词索引向量进行父标签嵌入操作得到文本词索引表征,然后进行转化生成待分类文本的语义向量;利用神经元有序的循环神经网络学习语义向量的层次结构,对层次结构的各层参数进行训练输出文本表征;利用多层感知器对文本表征进行非线性操作,获取待分类文本各层标签对应的概率分布;根据文本最后一层标签的概率分布获取文本分类结果。本发明将神经元有序的循环神经网络和多层感知器的组合模型处理大量标签的文本分类任务,涉及的参数少收敛速度快,通过对文本进行逐层的方式,与现有的平面分类器相比,大大提高了分类性能。
-
公开(公告)号:CN113537372A
公开(公告)日:2021-10-22
申请号:CN202110837807.0
申请日:2021-07-23
Applicant: 全球能源互联网研究院有限公司 , 国网江苏省电力有限公司营销服务中心 , 国家电网有限公司
IPC: G06K9/62 , G06F40/295
Abstract: 本申请是关于一种地址识别方法、装置、设备及存储介质,具体涉及人工智能领域。所述方法包括:获取目标文本中各个分段文本对应的特征向量;分段文本包含至少一个单字;根据各个分段文本分别对应的特征向量,获取各个分段文本分别对应的地址类别;将至少两种地址类别分别对应的分段文本,按照地址类别进行排序并连接,获得目标文本中的地址文本。上述方案将目标文本拆分为多个部分的信息,并对各个部分都进行类别识别,当识别完成后,再根据地址类别,将与地址文本有关的分段文本组合起来,从而实现在语序规则较为自由的自然语言中,也可以准确地判断出地址文本,提高了地址文本的获取准确性。
-
公开(公告)号:CN111309868B
公开(公告)日:2023-08-29
申请号:CN202010104775.9
申请日:2020-02-20
Applicant: 全球能源互联网研究院有限公司 , 国家电网有限公司 , 国网浙江省电力有限公司
Abstract: 本发明公开了一种知识图谱构建、检索方法及装置,应用于电力终端设备的关系数据表,其中,知识图谱构建方法包括:获取至少一个电力终端设备的关系数据表;根据所述关系数据表构建知识图谱概念层及知识图谱实例层;将所述知识图谱概念层与所述知识图谱实例层进行组合形成知识图谱。本发明通过将表格数据转换为概念层和实例层,能够更加清晰的体现关系数据之间的关系,提高用户需求理解和资源描述的准确度。
-
公开(公告)号:CN111611370B
公开(公告)日:2023-04-18
申请号:CN202010455362.5
申请日:2020-05-26
Applicant: 全球能源互联网研究院有限公司 , 国家电网有限公司
IPC: G06F16/332 , G06F40/35 , G06Q50/06
Abstract: 本发明涉及数据处理技术领域,具体涉及电费查询方法及电子设备。方法包括获取与用户意图对应的自然语言问句;利用用户意图识别模型对自然语言问句进行自然语言的理解,以确定用户意图;当确定用户意图为电费查询时,向用户推送询问用户编码的消息;获取用户反馈的答复信息;基于用户反馈的答复信息,利用对话管理模型确定向用户推送的下一个消息与用户进行对话,以向用户推送所述电费查询的结果。利用用户意图识别模型对自然语言问句进行理解确定出用户意图;利用对话管理模型确定向用户推送下一个消息,以实现向用户推送电费查询的结果。该方法不仅能够满足用户随时随地的电费查询,且能够代替人工客服处理电费查询的业务,提高电费查询的效率。
-
-
-
-
-
-
-
-
-