-
公开(公告)号:CN102237083A
公开(公告)日:2011-11-09
申请号:CN201010160521.5
申请日:2010-04-23
摘要: 本发明为一种基于WinCE平台的便携式口语翻译系统,包括语音采集器、语音预处理模块、语音特征提取与建模模块、模型库、识别模块、语料库和翻译与语音合成模块,所有模块均建立在嵌入式平台上;语音采集模块与语音预处理模块连接;语音预处理模块与语音特征提取与建模模块连接;语音特征提取与建模模块分别与模型库或识别模块连接;所述语音特征提取与建模模块通过选择为训练状态与模型库连接,通过选择识别状态,与识别模块连接;识别模块与翻译与语音合成模块连接;翻译与语音合成模块与语料库连接。本发明具有语音识别时效率更高,识别准确率高,设备便携性强,双向口语翻译的特点。
-
公开(公告)号:CN201773400U
公开(公告)日:2011-03-23
申请号:CN201020105282.9
申请日:2010-01-28
摘要: 本实用新型公开了一种嵌入式体育词汇翻译系统,系统包括与系统主板连接的中央控制器、液晶显示触摸屏、电源模块、存储器、语音采集模块、语音识别模块、语音合成模块、语音库模块,通过所述语音采集模块采集说话人的语音信号,通过语音识别模块、语音库模块、语音合成模块分别进行语音识别、中英文翻译以及语音合成输出。能够使人们以便携智能设备为中介,实现在特定流域内的中英语音转换。
-
公开(公告)号:CN111402901B
公开(公告)日:2023-04-18
申请号:CN202010226730.9
申请日:2020-03-27
申请人: 广东外语外贸大学
发明人: 张晶
摘要: 本发明公开一种基于彩色图像RGB映射特征的CNN声纹识别方法及系统,该方法的实现过程为:S1:输入语音数据;S2:提取特征,从语音数据中提取特征,所提取特征包括:静态、一阶差分,二阶差分特征,用以充当图像RGB中红色、绿色和蓝色的角色;S3:将提出的特征输入到构建的CNN模型,得出识别结果。本发明与现有技术相比,相比较于传统GMM模型识别率具有显著的提高;语音时长对于CNN识别率的影响很小,在噪声环境下,CNN识别率依然维持在很高的水平,说明CNN对于噪声具有很好的鲁棒性。
-
公开(公告)号:CN111402901A
公开(公告)日:2020-07-10
申请号:CN202010226730.9
申请日:2020-03-27
申请人: 广东外语外贸大学
发明人: 张晶
摘要: 本发明公开一种基于彩色图像RGB映射特征的CNN声纹识别方法及系统,该方法的实现过程为:S1:输入语音数据;S2:提取特征,从语音数据中提取特征,所提取特征包括:静态、一阶差分,二阶差分特征,用以充当图像RGB中红色、绿色和蓝色的角色;S3:将提出的特征输入到构建的CNN模型,得出识别结果。本发明与现有技术相比,相比较于传统GMM模型识别率具有显著的提高;语音时长对于CNN识别率的影响很小,在噪声环境下,CNN识别率依然维持在很高的水平,说明CNN对于噪声具有很好的鲁棒性。
-
公开(公告)号:CN104732972B
公开(公告)日:2018-02-27
申请号:CN201510109362.9
申请日:2015-03-12
申请人: 广东外语外贸大学
摘要: 本发明提出一种基于分组统计的HMM声纹识别签到方法及系统,首先签到客户端采集签到者的声纹信号,对声纹信号依次进行预加重、分帧、加窗和端点检测的预处理并通过网络传输至服务器,然后签到服务器端对声纹信号进行声纹特征参数提取,生成签到者分组特征参数以及生成分组模型的分组特征参数;根据分组模型的每个分组的分组特征参数与签到者声纹的分组特征参数,判断签到者是否为某个分组的成员;最后对签到者的声纹进行判定。本发明能在签到人数量较大的情况下,实现实时、高效的声纹识别签到,减少公用设备的投入,既方便又高效,本发明系统和方法的结合实现了高识别效率、高实时性的声纹识别签到。
-
公开(公告)号:CN102789779A
公开(公告)日:2012-11-21
申请号:CN201210242311.X
申请日:2012-07-12
申请人: 广东外语外贸大学
摘要: 本发明公开一种语音识别系统及其识别方法,系统包括语音采集模块、语音预处理模块、语音特征提取模块、分组判定模块和语音识别模块,分组判定模块用于对语音进行聚类分组;语音采集模块与语音预处理模块连接,语音预处理模块与语音特征提取模块连接,语音特征提取与分组判定模块连接,分组判定模块与语音识别模块连接;分组判定模块包括分组判断单元和不少于2个的分组模型;语音特征提取模块与分组判断单元连接,分组判断单元分别与不少于2个的分组模型连接;分组模型与语音识别模块连接。
-
公开(公告)号:CN104732972A
公开(公告)日:2015-06-24
申请号:CN201510109362.9
申请日:2015-03-12
申请人: 广东外语外贸大学
摘要: 本发明提出一种基于分组统计的HMM声纹识别签到方法及系统,首先签到客户端采集签到者的声纹信号,对声纹信号依次进行预加重、分帧、加窗和端点检测的预处理并通过网络传输至服务器,然后签到服务器端对声纹信号进行声纹特征参数提取,生成签到者分组特征参数以及生成分组模型的分组特征参数;根据分组模型的每个分组的分组特征参数与签到者声纹的分组特征参数,判断签到者是否为某个分组的成员;最后对签到者的声纹进行判定。本发明能在签到人数量较大的情况下,实现实时、高效的声纹识别签到,减少公用设备的投入,既方便又高效,本发明系统和方法的结合实现了高识别效率、高实时性的声纹识别签到。
-
公开(公告)号:CN105096955A
公开(公告)日:2015-11-25
申请号:CN201510563935.5
申请日:2015-09-06
申请人: 广东外语外贸大学
摘要: 本发明公开一种基于模型生长聚类的说话人快速识别方法及系统,所述方法包括模型训练和模型识别,模型训练包括采集包括说话人在内的多人的声纹信号;对各声纹信号进行预处理并提取声纹特征参数,形成多个模型;采用模型生长聚类算法对所有的模型进行自适应归类;模型识别包括采集说话人的语音信号进行预处理并提取声纹特征参数,计算待识别语音信号的特征参数到各类代表的似然度,以似然度最大原则选择所属的类,进而与选择的类中所有模型计算似然得分,得分最高的模型即为识别结果。本发明方法无需将待识别语音特征与所有模型进行匹配,因此匹配时间短、实时性好,能够很好地适应大规模的模型库。
-
公开(公告)号:CN105096955B
公开(公告)日:2019-02-01
申请号:CN201510563935.5
申请日:2015-09-06
申请人: 广东外语外贸大学
摘要: 本发明公开一种基于模型生长聚类的说话人快速识别方法及系统,所述方法包括模型训练和模型识别,模型训练包括采集包括说话人在内的多人的声纹信号;对各声纹信号进行预处理并提取声纹特征参数,形成多个模型;采用模型生长聚类算法对所有的模型进行自适应归类;模型识别包括采集说话人的语音信号进行预处理并提取声纹特征参数,计算待识别语音信号的特征参数到各类代表的似然度,以似然度最大原则选择所属的类,进而与选择的类中所有模型计算似然得分,得分最高的模型即为识别结果。本发明方法无需将待识别语音特征与所有模型进行匹配,因此匹配时间短、实时性好,能够很好地适应大规模的模型库。
-
-
-
-
-
-
-
-