发明公开
- 专利标题: 一种语音命令识别方法、介质及设备
-
申请号: CN202410373036.8申请日: 2024-03-29
-
公开(公告)号: CN118280362A公开(公告)日: 2024-07-02
- 发明人: 李民荣 , 李晟 , 陈柯安 , 曹运明 , 李奇楠 , 杨家俊
- 申请人: 江西理工大学
- 申请人地址: 江西省赣州市章贡区红旗大道86号
- 专利权人: 江西理工大学
- 当前专利权人: 江西理工大学
- 当前专利权人地址: 江西省赣州市章贡区红旗大道86号
- 代理机构: 长沙七源专利代理事务所
- 代理商 周晓艳; 杨丽娜
- 主分类号: G10L15/22
- IPC分类号: G10L15/22 ; G10L19/00 ; G10L17/04
摘要:
本发明涉及智能语音识别技术领域,公开一种语音命令识别方法、介质及设备,通过本发明的语音命令识别方法,结合了预训练的非线性编码模型、自回归模型、堆叠GRU模型和分类输出模型,完全使用深度学习模型作为特征和分类器,利用预训练的非线性编码模型和自回归模型,能够从原始语音信号中学习到更具有表征能力的特征表示,堆叠GRU模型的使用可以更好地捕捉语音序列的整体的信息,提高了识别的准确性和鲁棒性,并且可以广泛应用于语音助手、智能家居控制系统和车载语音控制等场景,具有较强的泛化能力。