专利检索 ap:("北京远鉴信息技术有限公司") AND inv:"王延凯" 第 1 页

1.

发明公开
一种心音识别方法、装置、电子设备及存储介质审中-实审

公开(公告)号：CN117334224A

公开(公告)日：2024-01-02

申请号：CN202311274076.9

申请日：2023-09-28

申请人： 北京远鉴信息技术有限公司

发明人： 王延凯 , 王秋明

IPC分类号： G10L25/66 , A61B7/04 , G06N3/044 , G10L25/30 , G10L25/03 , G10L25/24

摘要： 本公开提供了一种心音识别方法、装置、电子设备及存储介质，通过提取原始心音信号对应的MFCC特征与GFCC特征融合生成目标融合特征；划分目标融合特征为多个特征片段，针对每个特征片段，分别确定CRNN模型与ResNet18模型针对特征片段输出的心音分类结果中，归属于每个心音类别的片段数占片段总数的比例系数，以及特征片段对应每个心音类别的概率得分；根据概率得分与比例系数，确定融合判决得分，并将CRNN模型对应的融合判决得分以及ResNet18模型对应的融合判决得分加权求和，确定目标判决得分；将目标判决得分的最大值对应的列作为目标心音识别结果。采用多特征、多模型、多融合的方式提高模型的鲁棒性，提升心音分类的准确率。

2.

发明公开
一种语音对抗样本生成方法、装置、电子设备及存储介质审中-实审

公开(公告)号：CN118522290A

公开(公告)日：2024-08-20

申请号：CN202410970241.2

申请日：2024-07-19

申请人： 北京远鉴信息技术有限公司

发明人： 郑榕 , 王延凯

IPC分类号： G10L17/06 , G10L17/26 , G10L17/18 , G10L25/30 , G10L25/51 , G10L25/60

摘要： 本申请提供了一种语音对抗样本生成方法、装置、电子设备及存储介质，包括：将目标语音信号输入至声纹分类模型以及鉴伪分类模型之中，确定出声纹损失值以及鉴伪损失值；基于梯度反向传播计算，确定出声纹维度上的第一扰动信号以及鉴伪维度上的第一扰动信号；将初始对抗样本以及目标语音信号输入至音质评价模型之中，确定出质量维度上的第一扰动信号，基于声纹分类模型以及鉴伪分类模型对初始对抗样本进行处理，确定出声纹维度上的第二扰动信号以及鉴伪维度上的第二扰动信号，对多个扰动信号进行加权融合，确定出目标语音信号的目标对抗样本。实现了在保证高音频相似度和音质的前提下，大大减少了生成对抗样本的时间。