一种语音命令识别方法、介质及设备

发明公开

请登陆查看更多内容

专利标题： 一种语音命令识别方法、介质及设备
申请号： CN202410373036.8

申请日： 2024-03-29
公开(公告)号： CN118280362A

公开(公告)日： 2024-07-02
发明人: 李民荣 , 李晟 , 陈柯安 , 曹运明 , 李奇楠 , 杨家俊
申请人： 江西理工大学
申请人地址： 江西省赣州市章贡区红旗大道86号
专利权人： 江西理工大学
当前专利权人： 江西理工大学
当前专利权人地址： 江西省赣州市章贡区红旗大道86号
代理机构： 长沙七源专利代理事务所
代理商 周晓艳; 杨丽娜
主分类号： G10L15/22
IPC分类号： G10L15/22 ; G10L19/00 ; G10L17/04

摘要：

本发明涉及智能语音识别技术领域，公开一种语音命令识别方法、介质及设备，通过本发明的语音命令识别方法，结合了预训练的非线性编码模型、自回归模型、堆叠GRU模型和分类输出模型，完全使用深度学习模型作为特征和分类器，利用预训练的非线性编码模型和自回归模型，能够从原始语音信号中学习到更具有表征能力的特征表示，堆叠GRU模型的使用可以更好地捕捉语音序列的整体的信息，提高了识别的准确性和鲁棒性，并且可以广泛应用于语音助手、智能家居控制系统和车载语音控制等场景，具有较强的泛化能力。

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L15/00	语音识别（G10L17/00优先）
G10L15/22	.在语音识别过程中（例如在人机对话过程中）使用的程序