一种基于瓶颈特征和残差网络的语音关键词检索方法

    公开(公告)号:CN114780786B

    公开(公告)日:2024-05-14

    申请号:CN202210390224.2

    申请日:2022-04-14

    申请人: 新疆大学

    摘要: 本发明公开了一种基于瓶颈特征和残差神经网络的语音关键词检索的方法,所述方法包括以下步骤:步骤1:预处理数据:对训练数据预处理,利用预训练前馈网络得到数据集的瓶颈特征,再生成相似矩阵图像;步骤2:模型训练:构建语音关键词检索模型,将处理后的数据和标签输入残差神经网络,完成关键词检索模型的训练;步骤3:模型测试:对测试集进行关键词检索,并给出置信度判断;步骤4:模型评估:采用准确率、召回率和F1评估关键词检索模型性能;本发明将语音关键词检索任务转化为图像二分类任务,从根本上解决了传统低资源语音关键词检索对语料库资源规模要求高的问题,更加简便快捷的实现低资源语音关键词检索。

    一种基于瓶颈特征和残差网络的语音关键词检索方法

    公开(公告)号:CN114780786A

    公开(公告)日:2022-07-22

    申请号:CN202210390224.2

    申请日:2022-04-14

    申请人: 新疆大学

    摘要: 本发明公开了一种基于瓶颈特征和残差神经网络的语音关键词检索的方法,所述方法包括以下步骤:步骤1:预处理数据:对训练数据预处理,利用预训练前馈网络得到数据集的瓶颈特征,再生成相似矩阵图像;步骤2:模型训练:构建语音关键词检索模型,将处理后的数据和标签输入残差神经网络,完成关键词检索模型的训练;步骤3:模型测试:对测试集进行关键词检索,并给出置信度判断;步骤4:模型评估:采用准确率、召回率和F1评估关键词检索模型性能;本发明将语音关键词检索任务转化为图像二分类任务,从根本上解决了传统低资源语音关键词检索对语料库资源规模要求高的问题,更加简便快捷的实现低资源语音关键词检索。