声纹验证方法、装置、设备及存储介质

    公开(公告)号:CN110335608B

    公开(公告)日:2023-11-28

    申请号:CN201910522762.0

    申请日:2019-06-17

    IPC分类号: G10L15/26 G10L17/00

    摘要: 本申请涉及生物识别领域,具体使用了预先训练好的音素模型实现语音处理,并公开了一种声纹验证方法、装置、设备及存储介质,所述方法包括:将语音信息进行文本转化,以得到对应的文本信息;根据预设的音素模型,获取所述文本信息对应的音素集合,所述音素集合包括所述文本信息中每个字所对应的声母和韵母;根据声母表和所述音素集合中的各声母,计算所述音素集合的声母覆盖率;根据韵母表和所述音素集合中的各韵母,计算所述音素集合的韵母覆盖率;根据所述声母覆盖率和所述韵母覆盖率,对所述语音信息进行声纹验证,以生成验证结果。进而找出用户语音特征完整度高的语音信息,为声纹身份验证提供了重要的参考。

    基于多模态的帕金森病检测装置及计算机可读存储介质

    公开(公告)号:CN113317763B

    公开(公告)日:2024-03-19

    申请号:CN202110735163.4

    申请日:2021-06-30

    IPC分类号: A61B5/00 A61B5/11

    摘要: 本申请实施例属于人工智能技术,可应用于数字医疗领域,涉及一种基于多模态的帕金森病检测装置,包括采集模块、特征提取模块、特征融合模块以及预测模块,通过该装置采集测试对象的多种模态信息,分别从多种模态信息中提取出每个模态对应的模态特征,对模态特征进行特征融合得到中间融合特征,并根据中间融合特征得到目标融合特征,并对目标融合特征进行分类,得到分类结果,并根据分类结果进行帕金森病的预测。本申请还提供一种计算机可读存储介质。此外,本申请还涉及区块链技术,多种模态信息可存储于区块链中。本申请提高帕金森病的识别率,从而为医生的诊断提供了有效的辅助作用。

    基于浅层学习和深度学习融合的心音识别方法及相关装置

    公开(公告)号:CN113855065A

    公开(公告)日:2021-12-31

    申请号:CN202111141595.9

    申请日:2021-09-28

    IPC分类号: A61B7/04

    摘要: 本申请涉及人工智能技术领域,提出一种基于浅层学习和深度学习融合的心音识别方法及相关装置,其中方法包括:对原始心音信号进行预处理,得到待识别心音信号;基于浅层学习的第一心音识别模型对所述待识别心音信号进行特征提取,得到目标浅层心音特征;基于深层学习的第二心音识别模型对所述待识别心音信号进行特征提取,得到目标深层心音特征;对所述目标浅层心音特征和所述目标深层心音特征进行决策融合,得到目标心音分类结果。采用本申请,可提高心音识别的准确率。

    基于多模态的帕金森病检测装置及计算机可读存储介质

    公开(公告)号:CN113317763A

    公开(公告)日:2021-08-31

    申请号:CN202110735163.4

    申请日:2021-06-30

    IPC分类号: A61B5/00 A61B5/11

    摘要: 本申请实施例属于人工智能技术,可应用于数字医疗领域,涉及一种基于多模态的帕金森病检测装置,包括采集模块、特征提取模块、特征融合模块以及预测模块,通过该装置采集测试对象的多种模态信息,分别从多种模态信息中提取出每个模态对应的模态特征,对模态特征进行特征融合得到中间融合特征,并根据中间融合特征得到目标融合特征,并对目标融合特征进行分类,得到分类结果,并根据分类结果进行帕金森病的预测。本申请还提供一种计算机可读存储介质。此外,本申请还涉及区块链技术,多种模态信息可存储于区块链中。本申请提高帕金森病的识别率,从而为医生的诊断提供了有效的辅助作用。

    基于浅层学习和深度学习融合的心音识别方法及相关装置

    公开(公告)号:CN113855065B

    公开(公告)日:2023-09-22

    申请号:CN202111141595.9

    申请日:2021-09-28

    IPC分类号: A61B7/04

    摘要: 本申请涉及人工智能技术领域,提出一种基于浅层学习和深度学习融合的心音识别方法及相关装置,其中方法包括:对原始心音信号进行预处理,得到待识别心音信号;基于浅层学习的第一心音识别模型对所述待识别心音信号进行特征提取,得到目标浅层心音特征;基于深层学习的第二心音识别模型对所述待识别心音信号进行特征提取,得到目标深层心音特征;对所述目标浅层心音特征和所述目标深层心音特征进行决策融合,得到目标心音分类结果。采用本申请,可提高心音识别的准确率。

    一种音频信号处理方法及装置

    公开(公告)号:CN110880327A

    公开(公告)日:2020-03-13

    申请号:CN201911038804.X

    申请日:2019-10-29

    IPC分类号: G10L17/02 G10L17/04 G10L17/22

    摘要: 本申请公开一种音频信号处理的方法及装置,其中,所述音频信号处理方法包括:获取待处理的第一音频信号;确定所述第一音频信号包含的至少一个音素;计算所述至少一个音素的音素覆盖率,若所述音素覆盖率满足目标条件,则将第一声纹识别模型更新为第二声纹识别模型。采用本申请的技术方案,能够保证最终得到的声纹识别模型是通过能较为完整地反映用户发音特征的音频信号训练得到的,提高声纹识别模型进行说话人辨识的准确度。

    鸟声识别模型的构建方法、装置、计算机设备及存储介质

    公开(公告)号:CN110120224B

    公开(公告)日:2023-01-20

    申请号:CN201910390381.1

    申请日:2019-05-10

    摘要: 本发明涉及声音识别领域,公开了一种鸟声识别模型的构建方法、装置、计算机设备及存储介质。其方法包括:获取鸟声样本,鸟声样本包括声音片段,每个鸟声样本与一个鸟名标签对应;从声音片段中提取梅尔频率倒谱特征,获得声音片段的多个频谱图;对多个频谱图进行特征提取和降维处理,获得声音片段对应的特征图;将特征图进行声纹特征编码处理,获得声纹特征向量;将声纹特征向量输入胶囊网络进行训练,训练完毕后获得鸟声识别模型,鸟声识别模型包括训练完毕后的胶囊网络。本发明所获得鸟声识别模型可用于对包含鸟声的声音片段进行处理,识别出鸟的类别。

    复合语音识别方法、装置、设备及计算机可读存储介质

    公开(公告)号:CN110444202A

    公开(公告)日:2019-11-12

    申请号:CN201910601019.4

    申请日:2019-07-04

    摘要: 本发明涉及人工智能领域,使用了深度学习实现了通过胶囊网络模型识别出复合语音信号的语音类型。具体共公开了一种复合语音识别方法、装置、计算机设备及计算机可读存储介质,该方法包括:实时或定时检测预置范围内的复合语音;当检测到所述复合语音时,获取所述复合语音的声音信号;对所述声音信号进行短时傅里叶变换,生成所述复合语音信号的时频图;基于预置胶囊网络模型,提取所述时频图的多个频谱,获取各个所述频谱的梅尔频率倒谱系数;通过所述预置胶囊网络模型,计算出各个所述梅尔频率倒谱系数的向量模,并根据各个所述梅尔频率倒谱系数的向量模确定所述复合语音的类型。

    音频单音色分离方法、装置、计算机设备及存储介质

    公开(公告)号:CN110335622A

    公开(公告)日:2019-10-15

    申请号:CN201910511337.1

    申请日:2019-06-13

    摘要: 本发明公开了一种音频单音色分离方法、装置、计算机设备及存储介质,应用于音频处理技术领域,用于解决现有技术无法实现单音色分离的问题。本发明提供的方法包括:获取待音频分离的目标音频;确定针对目标音频所需分离的各个音色种类;从预先训练好的各个LSTM神经网络中选取出与各个音色种类对应的一个LSTM神经网络,作为目标LSTM神经网络,各个LSTM神经网络分别采用不同的音色种类组合所对应的音频样本预先训练得到,每个音色种类组合由两个以上音色种类组成;将目标音频作为输入投入至目标LSTM神经网络,得到输出的各个目标频谱图;将各个目标频谱图分别进行时域变换,得到各个目标频谱图各自对应的目标单音色音频,作为目标音频的音频分离结果。

    鸟类声音识别方法、装置、计算机设备和存储介质

    公开(公告)号:CN110246504A

    公开(公告)日:2019-09-17

    申请号:CN201910420152.X

    申请日:2019-05-20

    摘要: 本申请涉及分类模型领域,使用卷积神经网络实现对鸟类声音类别的识别。具体公开了一种鸟类声音识别方法、装置、计算机设备和存储介质,该方法包括:根据小波变换算法对获取的鸟声录音数据进行降噪处理,以得到降噪鸟声信号;对降噪鸟声信号进行预加重、分帧和加窗,对得到的窗口数据进行快速傅里叶变换和取平方处理,得到窗口数据各自对应的谱线能量;基于梅尔滤波器组对各谱线能量进行处理,对得到窗口数据各自对应的梅尔频谱数据进行倒谱分析并对倒谱分析的结果进行一阶差分和二阶差分,获得窗口数据各自对应的梅尔倒谱特征向量;基于训练好的卷积神经网络,根据梅尔倒谱特征向量对降噪鸟声信号进行识别,输出降噪鸟声信号对应的鸟类识别数据。