- 专利标题: 一种基于彩色图像RGB映射特征的CNN声纹识别方法及系统
-
申请号: CN202010226730.9申请日: 2020-03-27
-
公开(公告)号: CN111402901B公开(公告)日: 2023-04-18
- 发明人: 张晶
- 申请人: 广东外语外贸大学
- 申请人地址: 广东省广州市番禺区广州大学城广东外语外贸大学(南校区)
- 专利权人: 广东外语外贸大学
- 当前专利权人: 广东外语外贸大学
- 当前专利权人地址: 广东省广州市番禺区广州大学城广东外语外贸大学(南校区)
- 代理机构: 广州赤信知识产权代理事务所
- 代理商 龚素琴; 田春雷
- 主分类号: G10L17/18
- IPC分类号: G10L17/18 ; G10L17/02 ; G10L17/04 ; G10L17/20 ; G06N3/0464 ; G06N3/08
摘要:
本发明公开一种基于彩色图像RGB映射特征的CNN声纹识别方法及系统,该方法的实现过程为:S1:输入语音数据;S2:提取特征,从语音数据中提取特征,所提取特征包括:静态、一阶差分,二阶差分特征,用以充当图像RGB中红色、绿色和蓝色的角色;S3:将提出的特征输入到构建的CNN模型,得出识别结果。本发明与现有技术相比,相比较于传统GMM模型识别率具有显著的提高;语音时长对于CNN识别率的影响很小,在噪声环境下,CNN识别率依然维持在很高的水平,说明CNN对于噪声具有很好的鲁棒性。
公开/授权文献
- CN111402901A 一种基于彩色图像RGB映射特征的CNN声纹识别方法及系统 公开/授权日:2020-07-10