-
公开(公告)号:CN118536512A
公开(公告)日:2024-08-23
申请号:CN202410622180.0
申请日:2024-05-20
申请人: 广东电网有限责任公司 , 广东电网有限责任公司客户服务中心
IPC分类号: G06F40/30 , G06N3/088 , G06F40/289 , G06N3/045 , G06F16/33 , G06F16/338
摘要: 本发明涉及自然语言处理技术领域,公开了一种基于无监督知识增强的语义检索方法、系统、设备和介质,所述方法包括将索引数据输入两阶段语义检索模型进行语义检索,得到检索片段,其中,所述两阶段语义检索模型包括传统语义表征模型和深度语义表征模型;将所述检索片段输入提示词模型进行上下文学习,得到检索提示词,并将所述检索提示词输入语义大模型进行知识整合,得到索引数据的语义检索结果。本发明通过数据增强提升检索模型数据稀缺问题,利用两阶段语义检索,保证检索性能的时效性的同时提升检索性能,并引入大语义模型进行知识整合,从而有效提升了语义检索的准确性和高效性。
-
公开(公告)号:CN118260423A
公开(公告)日:2024-06-28
申请号:CN202410368726.4
申请日:2024-03-28
申请人: 广东电网有限责任公司 , 广东电网有限责任公司客户服务中心
IPC分类号: G06F16/35 , G06F18/214 , G06F18/21 , G06N20/00
摘要: 本发明公开了一种面向情境学习的机器学习模型训练的方法及系统,其中方法包括:获取预设的训练集,通过预设的信息评分方法对所述训练集的示例进行计算,得到所述示例的信息评分;根据所述示例的信息评分,通过预设的筛选条件,筛选出所有无信息量的示例,并得到高信息量的示例集合;根据高信息量的示例集合,通过预设的示例搜索方法进行处理,得到情境学习核心集;根据情境学习核心集,对机器学习模型进行情境学习训练。本发明通过得到适用于情景学习的核心集,提升了关于情境学习的机器学习模型的性能和训练精确度。
-
公开(公告)号:CN118194847A
公开(公告)日:2024-06-14
申请号:CN202410587159.1
申请日:2024-05-13
申请人: 广东电网有限责任公司 , 广东电网有限责任公司客户服务中心
IPC分类号: G06F40/205 , G06F40/284 , G06N20/00
摘要: 本发明公开了一种基于扩散模型的遮拦语言去噪方法及装置,包括:获取被遮拦的语句信息;其中,所述被遮拦的语句信息包括被遮拦词语和未被遮拦语句;将所述被遮拦的语句信息输入至预设吸收状态的离散扩散模型之中,从而输出得到对应该被遮拦词语的去噪信息,进而得到完整的语句信息。本发明通过获取被遮拦的语句信息,可以准确地识别出被遮拦的词语,从而避免了对完整语句信息的误解或丢失,同时将所述被遮拦的语句信息输入至预设吸收状态的离散扩散模型中,可以利用模型对被遮拦词语进行去噪处理,得到更准确的去噪信息,本发明相比其他文本扩散模型,提升了质量、效率和多样性,可以大大加速训练过程,降低计算成本,减少碳足迹。
-
公开(公告)号:CN118194238A
公开(公告)日:2024-06-14
申请号:CN202410591748.7
申请日:2024-05-14
申请人: 广东电网有限责任公司 , 广东电网有限责任公司客户服务中心
IPC分类号: G06F18/25 , G06F18/214 , G06F18/24 , G06N3/0455 , G06N3/0895 , G06N3/094
摘要: 本发明涉及情感识别技术领域,尤其涉及一种多语种多模态情感识别方法、系统及设备,包括采用自监督学习方法对无标注的多语种非平行语音、文本数据进行训练,得到自监督预训练模型,以对带标注的多语种多模态情感语料进行特征提取,得到多模态初级特征序列,并利用基于多模态重缩放注意力机制的模态协作融合网络进行多模态联合表征建模,从而根据多模态联合表征输出情感识别结果。本发明通过基于多模态重缩放注意力机制的模态协作融合网络对多模态联合表征建模,提升多模态特征融合效率,并根据多模态联合表征,通过线性层输出情感识别结果,同时引入梯度反转层进行语种对抗训练,进一步实现了跨语种深度语义对齐,提升了多语种情感识别的泛化性。
-
公开(公告)号:CN118486295A
公开(公告)日:2024-08-13
申请号:CN202410623310.2
申请日:2024-05-20
申请人: 广东电网有限责任公司 , 广东电网有限责任公司客户服务中心
摘要: 本发明公开了一种混合语音识别方法、系统、计算机设备和存储介质,包括根据第一单语种语音数据和第二单语种语音数据,建立第一单语种模型和第二单语种模型;将第一单语种语音数据和第二单语种语音数据进行拼接,得到混合语种数据,并根据混合语种数据,建立语种分类特征提取模型;将第一单语种模型、第二单语种模型和语种分类特征提取模型进行融合,得到混合语音识别模型;将待识别的混合语音数据输入混合语音识别模型,得到语音识别结果。本发明通过融合汉语、粤语单语种模型和语种分类特征提取模型的特征,构建了混合语音识别模型,能够自动识别输入语音的语种,并综合不同语种模型提供的特征进行识别,有效提高了语音识别的准确性和鲁棒性。
-
公开(公告)号:CN118194238B
公开(公告)日:2024-07-23
申请号:CN202410591748.7
申请日:2024-05-14
申请人: 广东电网有限责任公司 , 广东电网有限责任公司客户服务中心
IPC分类号: G06F18/25 , G06F18/214 , G06F18/24 , G06N3/0455 , G06N3/0895 , G06N3/094
摘要: 本发明涉及情感识别技术领域,尤其涉及一种多语种多模态情感识别方法、系统及设备,包括采用自监督学习方法对无标注的多语种非平行语音、文本数据进行训练,得到自监督预训练模型,以对带标注的多语种多模态情感语料进行特征提取,得到多模态初级特征序列,并利用基于多模态重缩放注意力机制的模态协作融合网络进行多模态联合表征建模,从而根据多模态联合表征输出情感识别结果。本发明通过基于多模态重缩放注意力机制的模态协作融合网络对多模态联合表征建模,提升多模态特征融合效率,并根据多模态联合表征,通过线性层输出情感识别结果,同时引入梯度反转层进行语种对抗训练,进一步实现了跨语种深度语义对齐,提升了多语种情感识别的泛化性。
-
公开(公告)号:CN105678447A
公开(公告)日:2016-06-15
申请号:CN201511034531.3
申请日:2015-12-31
申请人: 中国南方电网有限责任公司 , 广东电网有限责任公司电力调度控制中心 , 国电南瑞科技股份有限公司
CPC分类号: G06Q10/0631 , G06Q50/06
摘要: 本发明公开了一种电网上下级调度间CIM模型校验服务化方法,该方法在电网上下级调度系统间,利用上级调度对CIM模型解析、校验、比较功能的服务化封装,实现下级调度系统异步调用上级调度的模型校验功能完成对模型文件的解析、校验、比较;对CIM模型语法规范性进行验证,对CIM模型中电力系统规则进行校验,与历史模型进行比较形成差异结果;校验、比较的结果形成错误报告、差异模型下发给下级调度。通过该服务化的方法充分复用了上级调度的软件模块,同时给下级调度提供了规则统一的校验工具,促进整个区域多个调度系统CIM模型规范化。
-
-
-
-
-
-