一种基于深度学习的语音识别方法

发明授权

请登陆查看更多内容

专利标题： 一种基于深度学习的语音识别方法
申请号： CN202310914137.7

申请日： 2023-07-25
公开(公告)号： CN116631410B

公开(公告)日： 2023-10-24
发明人: 陈志丰 , 张灵芝
申请人： 陈志丰
申请人地址： 北京市朝阳区酒仙桥路6号院(国际电子城总部)360大厦A座7层
专利权人： 陈志丰
当前专利权人： 陈志丰
当前专利权人地址： 北京市朝阳区酒仙桥路6号院(国际电子城总部)360大厦A座7层
代理机构： 北京博识智信专利代理事务所
代理商 徐佳慧
主分类号： G10L17/18
IPC分类号： G10L17/18 ; G10L15/16 ; G10L21/0216

摘要：

本发明公开了一种基于深度学习的语音识别方法，该方法包括音源采集、音源预处理、抗噪增强、口语理解、说话人识别和语音识别，本发明属于语音识别技术领域，具体是指一种基于深度学习的语音识别方法。本方案采用时频去噪网络结合损失函数训练预测模型的方法进行对音源数据的抗噪增强，提高了音源数据的质量，采用基于集成学习的口语识别架构进行口语理解，提高了语音识别的可用性和精确性，采用基于决策函数的说话人身份识别和分类算法，分析和处理音源数据进行说话人识别，提高了语音识别的信息获取密度和优化了语音识别的信息获取结构，进而优化了语音识别的可靠性、可延展性和适用性。

公开/授权文献

CN116631410A 一种基于深度学习的语音识别方法公开/授权日：2023-08-22

信息查询

中国专利公布公告

审查信息

Global Dossier

Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L17/00	讲话者辨认或验证
G10L17/18	.人工神经网络，连接方法