基于人工智能的语音特征提取方法和装置

发明授权

请登陆查看更多内容

专利标题： 基于人工智能的语音特征提取方法和装置
申请号： CN201611238959.4

申请日： 2016-12-28
公开(公告)号： CN106782501B

公开(公告)日： 2020-07-24
发明人: 李超 , 李先刚
申请人： 百度在线网络技术(北京)有限公司
申请人地址： 北京市海淀区上地十街10号百度大厦三层
专利权人： 百度在线网络技术(北京)有限公司
当前专利权人： 百度在线网络技术(北京)有限公司
当前专利权人地址： 北京市海淀区上地十街10号百度大厦三层
代理机构： 北京清亦华知识产权代理事务所
代理商 宋合成
主分类号： G10L15/02
IPC分类号： G10L15/02 ; G10L15/16

摘要：

本发明提出一种基于人工智能的语音特征提取方法和装置，其中，方法包括：通过对待识别语音进行频谱分析，得到待识别语音的语谱图之后，利用VGG卷积神经网络对语谱图进行特征提取，得到语音特征。由于语谱图能够对待识别语音以图像的方式进行描述，而VGG卷积神经网络又是一种对图像进行处理的有效方式，因此，采用这种方式所提取出的语音特征能够对语音的特性进行准确描述。当根据所提取出的语音特征在进行语音识别时，能够解决现有技术中由于缺乏对语音特征进行有效提取所导致的语音识别准确度不高的技术问题。

公开/授权文献

CN106782501A 基于人工智能的语音特征提取方法和装置公开/授权日：2017-05-31

信息查询

中国专利公布公告

审查信息

Global Dossier

Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L15/00	语音识别（G10L17/00优先）
G10L15/02	.语音识别的特征提取；识别单位的选择