基于循环神经网络语音识别中语音数据增强方法及装置
Abstract:
语音识别处理领域的一种基于循环神经网络的语音数据增强的方法,旨在解决循环神经网络在语音识别中由于模拟语音识别中不规则语法现象引起的过度建模词间依赖的问题。方法包括:从输入的语音数据中提取标识语音的各个频率能量值的声学特征,生成声学特征向量(201);根据预设的标注文件和声学特征向量获得语音数据的语句标签序列(202);通过决策聚类预设的标注文件和语句标签序列获得决策聚类操作后的对齐文件(203);生成一个[0,1]之间的第一随机数γ,并与预设的调整比例α比较(204);如果第一随机数γ大于调整比例α,在边界文件所指示的位置对上述语音数据进行增强处理(205)。能够快速、方便地增加训练数据中不规则的口语化现象。
Patent Agency Ranking
0/0