一种基于彩色图像RGB映射特征的CNN声纹识别方法及系统

发明授权

CN111402901B 一种基于彩色图像RGB映射特征的CNN声纹识别方法及系统有权

请登陆查看更多内容

专利标题： 一种基于彩色图像RGB映射特征的CNN声纹识别方法及系统
申请号： CN202010226730.9

申请日： 2020-03-27
公开(公告)号： CN111402901B

公开(公告)日： 2023-04-18
发明人: 张晶
申请人： 广东外语外贸大学
申请人地址： 广东省广州市番禺区广州大学城广东外语外贸大学(南校区)
专利权人： 广东外语外贸大学
当前专利权人： 广东外语外贸大学
当前专利权人地址： 广东省广州市番禺区广州大学城广东外语外贸大学(南校区)
代理机构： 广州赤信知识产权代理事务所
代理商 龚素琴; 田春雷
主分类号： G10L17/18
IPC分类号： G10L17/18 ; G10L17/02 ; G10L17/04 ; G10L17/20 ; G06N3/0464 ; G06N3/08

摘要：

本发明公开一种基于彩色图像RGB映射特征的CNN声纹识别方法及系统，该方法的实现过程为：S1：输入语音数据；S2：提取特征，从语音数据中提取特征，所提取特征包括：静态、一阶差分，二阶差分特征，用以充当图像RGB中红色、绿色和蓝色的角色；S3：将提出的特征输入到构建的CNN模型，得出识别结果。本发明与现有技术相比，相比较于传统GMM模型识别率具有显著的提高；语音时长对于CNN识别率的影响很小，在噪声环境下，CNN识别率依然维持在很高的水平，说明CNN对于噪声具有很好的鲁棒性。

公开/授权文献

CN111402901A 一种基于彩色图像RGB映射特征的CNN声纹识别方法及系统公开/授权日：2020-07-10

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L17/00	讲话者辨认或验证
G10L17/18	.人工神经网络，连接方法