一种基于对抗训练的端到端的语音识别方法
摘要:
本发明公开了基于对抗训练的端到端的语音识别方法,其语音识别模型包括编码层和解码层,所述编码层包括卷积神经网络和自注意力机制,所述解码层为自注意力机制。该语音识别模型使用卷积神经网络构建编码层,同时引入自注意力机制,以获取局部特征,提升识别准确度。在使用该语音识别模型的语音识别方法,在识别过程中,由于频域表示的音频数据受音调、音色影响很小,因此使用频域表示来表示音频数据以降低音调音色影响,提高识别准确度。
0/0