流式端到端语音识别方法、装置及电子设备
Abstract:
一种流式端到端语音识别方法、装置及电子设备,方法包括:以帧为单位对接收到的语音流进行语音声学特征提取并进行编码(S301);对已完成编码的帧进行分块处理,并对同一分块中包含的需要进行编码输出的激活点数量进行预测(S302);根据预测结果确定需要进行解码输出的激活点所在的位置,以便解码器在激活点所在的位置进行解码并输出识别结果(S303)。通过本方法能够提升流式端到端语音识别系统对噪声的鲁棒性,进而提升系统性能以及准确度。
Patent Agency Ranking
0/0