-
公开(公告)号:CN118629427A
公开(公告)日:2024-09-10
申请号:CN202410724239.7
申请日:2024-06-05
Applicant: 科大讯飞股份有限公司 , 合肥智能语音创新发展有限公司
Abstract: 本申请提出一种异音检测方法、装置、电子设备、存储介质及产品,该方法提取待检测设备对应测点的音频,并对音频进行加噪处理,得到测点对应的加噪音频;基于待检测设备的工况,对加噪音频进行去噪重构处理,得到测点对应的重构音频,并基于音频和重构音频之间的重构差异,确定测点的音频对应的检测结果,检测结果表示测点的音频是否异常;其中,加噪处理算法和去噪重构处理的处理算法是通过对待检测设备对应测点的正常音频进行加噪和去噪重构处理确定的。采用本申请的技术方案,能够对测点的音频进行自动异音检测,提高了异音检测的效率和准确度。
-
公开(公告)号:CN118250408A
公开(公告)日:2024-06-25
申请号:CN202410267795.6
申请日:2024-03-08
Applicant: 科大讯飞股份有限公司
IPC: H04N5/262 , H04N5/265 , G06N3/045 , G06N3/0464 , G06N3/08
Abstract: 本发明提供一种音视频处理方法、装置、电子设备和存储介质,其中方法包括:将待处理的音视频流分次送入包含卷积层的神经网络处理系统进行计算,在经过卷积运算时,通过将历史输入数据与当前输入数据进行拼接,再基于预设掩码,对拼接数据进行掩码运算,以剔除某些时段拼接后的数据中的无效数据,从而得到与整体送入处理相一致的推理结果。本发明提供的方法、装置、电子设备和存储介质,通过对计算图的有效改造可以得到与训练一致的推理结果,从而保证推理端的算法效果,同时无需对模型进行重新训练,也无需在推理端的输入上进行重叠处理,减少了重复计算,大大提高了运行效率。
-
公开(公告)号:CN119763604A
公开(公告)日:2025-04-04
申请号:CN202411610719.7
申请日:2024-11-12
Applicant: 科大讯飞股份有限公司 , 合肥智能语音创新发展有限公司 , 浙江潮汐力科技有限公司
Abstract: 本发明提供一种变压器状态识别方法、装置、电子设备和存储介质,涉及电力技术领域,其中方法包括:获取变压器的待测音频数据;将待测音频数据输入声纹提取模型中,得到声纹提取模型输出的目标声纹;声纹提取模型是基于第一数量的第一样本变压器的无状态标签的第一样本音频数据训练得到的;基于目标声纹和至少一个注册声纹,对变压器的状态进行识别。本发明是先基于大量无状态标签的第一样本音频数据训练得到声纹提取模型,再通过声纹提取模型基于少量有状态标签的第二样本音频数据确定至少一个注册声纹,进而结合注册声纹实现变压器的状态识别,在只需要少量有状态标签的样本音频数据的情况下,提高了变压器状态识别的准确性。
-
公开(公告)号:CN119694302A
公开(公告)日:2025-03-25
申请号:CN202411769405.1
申请日:2024-12-04
Applicant: 合肥智能语音创新发展有限公司 , 科大讯飞股份有限公司
Abstract: 本申请公开了一种多语种语音识别模型训练方法及相关装置,涉及语音识别技术领域,包括:预先构建包含第一训练分支和第二训练分支的多语种语音识别模型训练模型,其中,第一训练分支和第二训练分支均由编码器和解码器组成,第一训练分支和第二训练分支共用解码器和部分编码器;通过语音文本有监督训练数据以及纯文本训练数据,对第一训练分支和第二训练分支进行多任务联合训练,得到训练好的第一训练分支作为多语种语音识别模型。该方案能够降低模型训练的计算开销,提高训练数据的利用率,从而在有效降低训练周期和减少有监督训练数据的情况下,训练得到一个高效、准确的多语种语音识别模型,进而提升多语种语音识别的效果。
-
公开(公告)号:CN119541495A
公开(公告)日:2025-02-28
申请号:CN202411461438.X
申请日:2024-10-18
Applicant: 合肥智能语音创新发展有限公司 , 科大讯飞股份有限公司
Abstract: 本申请公开了一种语音识别方法及相关装置、设备和存储介质,语音识别方法包括:获取当前轮次的第一解码特征;其中,当前轮次的第一解码特征包含上一轮次所输出解码字符的特征信息;获取待识别语音中各个语音帧的编码特征分别与第一解码特征之间的对齐概率,并基于对齐概率选择至少部分语音帧的编码特征与第一解码特征进行融合,得到第二解码特征;基于第二解码特征进行解码,得到当前轮次所输出的解码字符,并返回获取当前轮次的第一解码特征的步骤进行迭代,直至最新输出的解码字符表征语音识别结束为止,基于各个轮次的解码字符,得到待识别语音的识别文本。上述方案,能够提升语音识别的效率和准确性,特别是流式语音识别的效率和准确性。
-
公开(公告)号:CN118779761A
公开(公告)日:2024-10-15
申请号:CN202410989208.4
申请日:2024-07-23
Applicant: 科大讯飞股份有限公司
IPC: G06F18/243 , G06F18/2431 , G06N5/01 , G06N5/04
Abstract: 本申请公开了一种基于大模型的分类任务处理方法、装置、相关设备及计算机程序产品,本申请结合所要处理的目标分类任务的候选分类标签集合,配置了对应的分类标签前缀树,在调用大模型解码目标分类任务的分类结果的过程中,解码第i个token时,计算词表空间中各token的概率分布,并利用分类标签前缀树对概率分布进行剪枝,限制大模型每一次解码输出token时的词表空间,使得大模型最终的解码结果限制在分类标签前缀树所包含的各候选分类标签中,避免大模型输出的结果存在格式错误、内容冗余、与候选分类标签不匹配等问题,提升了大模型在处理分类任务时输出结果的质量。
-
公开(公告)号:CN103945000B
公开(公告)日:2017-06-13
申请号:CN201410187095.2
申请日:2014-05-05
Applicant: 科大讯飞股份有限公司
IPC: H04L29/08
Abstract: 本发明公开了一种负载均衡方法及负载均衡器,前者在请求信息中携带有指定负载均衡策略时,查找是否配置有指定负载均衡策略;如是,则调用指定负载均衡策略执行文件;如未配置指定负载均衡策略或者请求信息中未携带指定负载均衡策略,则查找是否针对请求信息中指定的服务类型配置了专属负载均衡策略;如是,则调用专属负载均衡策略执行文件;如否,则调用默认负载均衡策略执行文件;通过调用相应负载均衡策略执行文件从服务列表中筛选出满足请求信息要求的服务端。本发明支持客户端动态选择负载均衡策略,及支持为不同服务类型配置专属负载均衡策略,使得同一负载均衡器可同时支持为多个不同服务类型的服务集群。
-
公开(公告)号:CN119782899A
公开(公告)日:2025-04-08
申请号:CN202411754118.3
申请日:2024-12-02
Applicant: 科大讯飞股份有限公司 , 合肥智能语音创新发展有限公司 , 浙江潮汐力科技有限公司
IPC: G06F18/241 , G06F18/213 , G06F18/25 , G06V10/42 , G06V10/44 , G06N3/045 , G06N3/0464 , G06N3/0895 , G10L25/30 , G10L25/51 , G06F123/02
Abstract: 本发明提供一种设备状态识别方法、装置、电子设备和存储介质,其中方法包括:对待测设备的音频数据进行特征提取,得到音频特征,并对所述待测设备的图像数据进行特征提取,得到图像特征;将所述音频特征和所述图像特征输入至设备状态识别模型,得到所述设备状态识别模型输出的状态识别结果。本发明通过同时利用音频特征和图像特征进行设备状态识别,可以使模型捕捉到设备状态更全面、更丰富的信息,从而提高识别的准确性和鲁棒性,通过在模型中引入全局注意力模块和局部注意力模块,增加了多重注意力机制,可以有效去除冗余信息,并从全时域、全频域和局部细节三个层面上提升特征的表征能力,进一步提高识别的准确性和泛化能力。
-
公开(公告)号:CN119724187A
公开(公告)日:2025-03-28
申请号:CN202411981844.9
申请日:2024-12-31
Applicant: 合肥智能语音创新发展有限公司 , 科大讯飞股份有限公司
Abstract: 本申请公开了一种语音识别方法及相关装置,涉及语音处理技术领域,包括:在确定待识别语音数据的通用解码文本序列之后,先将通用解码文本序列转换为元素粒度更低的可泛化文本序列,再利用与可泛化文本序列中各元素对应的相似元素对可泛化文本序列进行扩充,得到相应粒度的扩充文本序列;并基于预设的长尾词汇语言模型对可泛化文本序列和扩充文本序列进行重贴分操作,得到长尾解码文本序列;最后,基于通用解码文本序列以及长尾解码文本序列,确定最终的语音识别结果。由于该方案能够得到长尾解码文本序列,因此能够提升最终的语音识别结果是长尾解码文本序列的可能性,因此,能够有效提升端到端语音识别模型的长尾词汇识别效果。
-
公开(公告)号:CN117112328A
公开(公告)日:2023-11-24
申请号:CN202310998086.0
申请日:2023-08-07
Applicant: 合肥智能语音创新发展有限公司 , 科大讯飞股份有限公司
Abstract: 本申请公开了一种NPU测试方法及相关装置、设备和存储介质,其中,NPU测试方法包括:在目标NPU和目标NPU的若干种计算模块中,选择待测对象;基于输入层、输出层和与待测对象,构造多个测试结构;获取各个测试结构独立运行的实测耗时;基于各个测试结构的实测耗时,得到待测对象数据处理的第一耗时以及待测对象与测试结构中待测对象的邻接对象之间数据传输的第二耗时。上述方案,能够精确且细致地测试NPU的运行效率。
-
-
-
-
-
-
-
-
-