面向语音交互场景语音片段的数据标注方法

    公开(公告)号:CN112786071A

    公开(公告)日:2021-05-11

    申请号:CN202110040225.X

    申请日:2021-01-13

    摘要: 本发明涉及面向语音交互场景语音片段的数据标注方法。标注方法包括:步骤1:模型训练;步骤2:对待识别语音数据的语音信号分帧加窗滤波处理;将接收到的语音数据首先进行分帧处理,选择25ms为一帧,在对分帧后的结果进行加窗处理,使得没一帧能够在处理后更加的平滑,根据需要再进行滤波处理;步骤3:对待识别语音数据进行特征提取,提取短时能量,过零率,梅尔频率倒谱系数,音高,基音周期,信噪比,谐噪比,短时平均幅度;对于每一帧语音计算上述特征,帧语音与特征共同构成了接下来的随机森林的输入数据;步骤4:根据阈值,将每一帧的类型输出并组成序列。此技术能够较好的保证模型准确率,识别出相关不同类型的语音片段。