一种基于说话人向量复用的语音识别系统及方法

发明授权

CN112420054B 一种基于说话人向量复用的语音识别系统及方法有权

请登陆查看更多内容

专利标题： 一种基于说话人向量复用的语音识别系统及方法
申请号： CN202011312979.8

申请日： 2020-11-20
公开(公告)号： CN112420054B

公开(公告)日： 2022-07-12
发明人: 秦艳姣
申请人： 湖北第二师范学院
申请人地址： 湖北省武汉市东湖新技术开发区高新二路129号
专利权人： 湖北第二师范学院
当前专利权人： 湖北第二师范学院
当前专利权人地址： 湖北省武汉市东湖新技术开发区高新二路129号
代理机构： 武汉知产时代知识产权代理有限公司
代理商 马帅
主分类号： G10L15/30
IPC分类号： G10L15/30 ; G10L15/02

摘要：

本发明提供一种基于说话人向量复用的语音识别系统，包括终端设备、说话人向量提取器、说话向量云缓存器、云端语音识别服务器和语音识别引擎，终端设备、说话人向量提取器、说话向量云缓存器和语音识别引擎分别与云端语音识别服务器连接。本发明的有益效果：本发明通过对说话人向量进行复用，并在语音识别引擎识别前通过云端语音识别服务器对终端说话人向量和云端说话人向量进行融合，从而提高语音识别引擎识别率，解决因提取的说话人向量的精度不高导致语音开始部分的识别率不高的问题。

公开/授权文献

CN112420054A 一种基于说话人向量复用的语音识别系统及方法公开/授权日：2021-02-26

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L15/00	语音识别（G10L17/00优先）
G10L15/28	.语音识别系统的结构细节
G10L15/30	..分布式识别，例如：客户端-服务器系统，为移动电话或网络应用