-
公开(公告)号:CN117334224A
公开(公告)日:2024-01-02
申请号:CN202311274076.9
申请日:2023-09-28
申请人: 北京远鉴信息技术有限公司
摘要: 本公开提供了一种心音识别方法、装置、电子设备及存储介质,通过提取原始心音信号对应的MFCC特征与GFCC特征融合生成目标融合特征;划分目标融合特征为多个特征片段,针对每个特征片段,分别确定CRNN模型与ResNet18模型针对特征片段输出的心音分类结果中,归属于每个心音类别的片段数占片段总数的比例系数,以及特征片段对应每个心音类别的概率得分;根据概率得分与比例系数,确定融合判决得分,并将CRNN模型对应的融合判决得分以及ResNet18模型对应的融合判决得分加权求和,确定目标判决得分;将目标判决得分的最大值对应的列作为目标心音识别结果。采用多特征、多模型、多融合的方式提高模型的鲁棒性,提升心音分类的准确率。
-
公开(公告)号:CN118522290A
公开(公告)日:2024-08-20
申请号:CN202410970241.2
申请日:2024-07-19
申请人: 北京远鉴信息技术有限公司
摘要: 本申请提供了一种语音对抗样本生成方法、装置、电子设备及存储介质,包括:将目标语音信号输入至声纹分类模型以及鉴伪分类模型之中,确定出声纹损失值以及鉴伪损失值;基于梯度反向传播计算,确定出声纹维度上的第一扰动信号以及鉴伪维度上的第一扰动信号;将初始对抗样本以及目标语音信号输入至音质评价模型之中,确定出质量维度上的第一扰动信号,基于声纹分类模型以及鉴伪分类模型对初始对抗样本进行处理,确定出声纹维度上的第二扰动信号以及鉴伪维度上的第二扰动信号,对多个扰动信号进行加权融合,确定出目标语音信号的目标对抗样本。实现了在保证高音频相似度和音质的前提下,大大减少了生成对抗样本的时间。
-