Invention Application
- Patent Title: 流式端到端语音识别方法、装置及电子设备
- Patent Title (English): STREAMING END-TO-END SPEECH RECOGNITION METHOD AND APPARATUS, AND ELECTRONIC DEVICE
-
Application No.: PCT/CN2021/089556Application Date: 2021-04-25
-
Publication No.: WO2021218843A1Publication Date: 2021-11-04
- Inventor: 张仕良 , 高志付
- Applicant: 阿里巴巴集团控股有限公司
- Applicant Address: 开曼群岛大开曼资本大厦一座四层847号邮箱, Grand Cayman
- Assignee: 阿里巴巴集团控股有限公司
- Current Assignee: 阿里巴巴集团控股有限公司
- Current Assignee Address: 开曼群岛大开曼资本大厦一座四层847号邮箱, Grand Cayman
- Agency: 北京三友知识产权代理有限公司
- Priority: CN202010366907.5 2020-04-30
- Main IPC: G10L15/20
- IPC: G10L15/20
Abstract:
一种流式端到端语音识别方法、装置及电子设备,方法包括:以帧为单位对接收到的语音流进行语音声学特征提取并进行编码(S301);对已完成编码的帧进行分块处理,并对同一分块中包含的需要进行编码输出的激活点数量进行预测(S302);根据预测结果确定需要进行解码输出的激活点所在的位置,以便解码器在激活点所在的位置进行解码并输出识别结果(S303)。通过本方法能够提升流式端到端语音识别系统对噪声的鲁棒性,进而提升系统性能以及准确度。
Information query