一种端到端的多语言连续语音流语音内容识别方法及系统

Invention Grant

CN113077785B 一种端到端的多语言连续语音流语音内容识别方法及系统有权

Please log in to see more content

Patent Title: 一种端到端的多语言连续语音流语音内容识别方法及系统
Application No.: CN201911300918.7

Application Date: 2019-12-17
Publication No.: CN113077785B

Publication Date: 2022-07-12
Inventor: 徐及 , 林格平 , 刘丹阳 , 万辛 , 张鹏远 , 李娅强 , 刘发强 , 颜永红
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
Applicant Address: 北京市海淀区北四环西路21号;
Assignee: 中国科学院声学研究所,国家计算机网络与信息安全管理中心
Current Assignee: 中国科学院声学研究所,国家计算机网络与信息安全管理中心
Current Assignee Address: 北京市海淀区北四环西路21号;
Agency: 北京方安思达知识产权代理有限公司
Agent 陈琳琳; 杨青
Main IPC: G10L15/08
IPC: G10L15/08 ; G10L15/00 ; G10L15/06 ; G10L15/16

Abstract:

本发明属于网络通信技术领域，具体涉及一种端到端的多语言连续语音流语音内容识别方法，该方法包括：将待识别的语音频谱特征输入至预先构建的基于深度神经网络的段级别语种分类模型，提取语句级别语种状态后验概率分布向量；将每一种语言种类的待识别的语音频谱特征序列和语句级别语种状态后验概率分布向量输入至预先构建的多语言语音识别模型，输出对应语言种类的语音识别结果。

Public/Granted literature

CN113077785A 一种端到端的多语言连续语音流语音内容识别方法及系统 Public/Granted day:2021-07-06

Information query

Chinese Patent Announcement Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L15/00	语音识别（G10L17/00优先）
G10L15/08	.语音分类或检索