一种基于彩色图像RGB映射特征的CNN声纹识别方法及系统

    公开(公告)号:CN111402901B

    公开(公告)日:2023-04-18

    申请号:CN202010226730.9

    申请日:2020-03-27

    发明人: 张晶

    摘要: 本发明公开一种基于彩色图像RGB映射特征的CNN声纹识别方法及系统,该方法的实现过程为:S1:输入语音数据;S2:提取特征,从语音数据中提取特征,所提取特征包括:静态、一阶差分,二阶差分特征,用以充当图像RGB中红色、绿色和蓝色的角色;S3:将提出的特征输入到构建的CNN模型,得出识别结果。本发明与现有技术相比,相比较于传统GMM模型识别率具有显著的提高;语音时长对于CNN识别率的影响很小,在噪声环境下,CNN识别率依然维持在很高的水平,说明CNN对于噪声具有很好的鲁棒性。

    一种基于彩色图像RGB映射特征的CNN声纹识别方法及系统

    公开(公告)号:CN111402901A

    公开(公告)日:2020-07-10

    申请号:CN202010226730.9

    申请日:2020-03-27

    发明人: 张晶

    摘要: 本发明公开一种基于彩色图像RGB映射特征的CNN声纹识别方法及系统,该方法的实现过程为:S1:输入语音数据;S2:提取特征,从语音数据中提取特征,所提取特征包括:静态、一阶差分,二阶差分特征,用以充当图像RGB中红色、绿色和蓝色的角色;S3:将提出的特征输入到构建的CNN模型,得出识别结果。本发明与现有技术相比,相比较于传统GMM模型识别率具有显著的提高;语音时长对于CNN识别率的影响很小,在噪声环境下,CNN识别率依然维持在很高的水平,说明CNN对于噪声具有很好的鲁棒性。

    一种基于分组统计的HMM声纹识别签到方法及系统

    公开(公告)号:CN104732972B

    公开(公告)日:2018-02-27

    申请号:CN201510109362.9

    申请日:2015-03-12

    IPC分类号: G10L15/14 G10L15/30

    摘要: 本发明提出一种基于分组统计的HMM声纹识别签到方法及系统,首先签到客户端采集签到者的声纹信号,对声纹信号依次进行预加重、分帧、加窗和端点检测的预处理并通过网络传输至服务器,然后签到服务器端对声纹信号进行声纹特征参数提取,生成签到者分组特征参数以及生成分组模型的分组特征参数;根据分组模型的每个分组的分组特征参数与签到者声纹的分组特征参数,判断签到者是否为某个分组的成员;最后对签到者的声纹进行判定。本发明能在签到人数量较大的情况下,实现实时、高效的声纹识别签到,减少公用设备的投入,既方便又高效,本发明系统和方法的结合实现了高识别效率、高实时性的声纹识别签到。

    一种语音识别系统及其识别方法

    公开(公告)号:CN102789779A

    公开(公告)日:2012-11-21

    申请号:CN201210242311.X

    申请日:2012-07-12

    发明人: 张晶 覃本灼

    IPC分类号: G10L15/02 G10L15/14

    摘要: 本发明公开一种语音识别系统及其识别方法,系统包括语音采集模块、语音预处理模块、语音特征提取模块、分组判定模块和语音识别模块,分组判定模块用于对语音进行聚类分组;语音采集模块与语音预处理模块连接,语音预处理模块与语音特征提取模块连接,语音特征提取与分组判定模块连接,分组判定模块与语音识别模块连接;分组判定模块包括分组判断单元和不少于2个的分组模型;语音特征提取模块与分组判断单元连接,分组判断单元分别与不少于2个的分组模型连接;分组模型与语音识别模块连接。

    一种基于分组统计的HMM声纹识别签到方法及系统

    公开(公告)号:CN104732972A

    公开(公告)日:2015-06-24

    申请号:CN201510109362.9

    申请日:2015-03-12

    IPC分类号: G10L15/14 G10L15/30

    摘要: 本发明提出一种基于分组统计的HMM声纹识别签到方法及系统,首先签到客户端采集签到者的声纹信号,对声纹信号依次进行预加重、分帧、加窗和端点检测的预处理并通过网络传输至服务器,然后签到服务器端对声纹信号进行声纹特征参数提取,生成签到者分组特征参数以及生成分组模型的分组特征参数;根据分组模型的每个分组的分组特征参数与签到者声纹的分组特征参数,判断签到者是否为某个分组的成员;最后对签到者的声纹进行判定。本发明能在签到人数量较大的情况下,实现实时、高效的声纹识别签到,减少公用设备的投入,既方便又高效,本发明系统和方法的结合实现了高识别效率、高实时性的声纹识别签到。

    一种基于模型生长聚类的说话人快速识别方法及系统

    公开(公告)号:CN105096955A

    公开(公告)日:2015-11-25

    申请号:CN201510563935.5

    申请日:2015-09-06

    发明人: 张晶 陈晓梅 郑党

    IPC分类号: G10L17/02 G10L17/06

    摘要: 本发明公开一种基于模型生长聚类的说话人快速识别方法及系统,所述方法包括模型训练和模型识别,模型训练包括采集包括说话人在内的多人的声纹信号;对各声纹信号进行预处理并提取声纹特征参数,形成多个模型;采用模型生长聚类算法对所有的模型进行自适应归类;模型识别包括采集说话人的语音信号进行预处理并提取声纹特征参数,计算待识别语音信号的特征参数到各类代表的似然度,以似然度最大原则选择所属的类,进而与选择的类中所有模型计算似然得分,得分最高的模型即为识别结果。本发明方法无需将待识别语音特征与所有模型进行匹配,因此匹配时间短、实时性好,能够很好地适应大规模的模型库。

    一种基于模型生长聚类的说话人快速识别方法及系统

    公开(公告)号:CN105096955B

    公开(公告)日:2019-02-01

    申请号:CN201510563935.5

    申请日:2015-09-06

    发明人: 张晶 陈晓梅 郑党

    IPC分类号: G10L17/02 G10L17/06

    摘要: 本发明公开一种基于模型生长聚类的说话人快速识别方法及系统,所述方法包括模型训练和模型识别,模型训练包括采集包括说话人在内的多人的声纹信号;对各声纹信号进行预处理并提取声纹特征参数,形成多个模型;采用模型生长聚类算法对所有的模型进行自适应归类;模型识别包括采集说话人的语音信号进行预处理并提取声纹特征参数,计算待识别语音信号的特征参数到各类代表的似然度,以似然度最大原则选择所属的类,进而与选择的类中所有模型计算似然得分,得分最高的模型即为识别结果。本发明方法无需将待识别语音特征与所有模型进行匹配,因此匹配时间短、实时性好,能够很好地适应大规模的模型库。

    一种空气折射率测量系统
    10.
    实用新型

    公开(公告)号:CN202119712U

    公开(公告)日:2012-01-18

    申请号:CN201120128500.5

    申请日:2011-04-27

    IPC分类号: G01N21/45

    摘要: 本实用新型公开了一种空气折射率测量系统,包括光学干涉成像模块和与光学干涉成像模块连接的气压泵模块,气压泵模块用于改变所测空气气压,还包括依次连接的图像信号捕获与转换模块、数据采集与传输模块和嵌入式系统数据处理模块,所述图像信号捕获与转换模块与光学干涉成像模块连接。本实用新型能精确地、自动地测量出空气压强变化所导致的干涉条纹变化数,从而精确地测出了空气折射率的数值。