一种用于语音测谎的半监督加性噪声自编码器

    公开(公告)号:CN110009025B

    公开(公告)日:2023-03-24

    申请号:CN201910239533.8

    申请日:2019-03-27

    Abstract: 现有的语音谎言检测算法受制于难以获得足量的带标签语音数据,而现实中大量易得的无标签数据却被忽视,针对这一问题,本发明提出了一种用于语音测谎的半监督加性噪声自编码器,它包含有两层的编码和解码网络,以及一个分类器。该模型首先根据语音谎言的特征改变了网络中的激活函数,其次为了防止过拟合,在每一个网络层都增加了dropout,最后在编码输出部分直接连接了分类器使网络简洁高效。数据输入模型后,先经过编码网络提取特征,之后不仅进入解码网络进行重构,还要进入分类器进行分类。无标签数据保证了模型的泛化性,有标签数据可以保证提取到的特征更适合分类,因此,我们的模型充分利用了有标签和无标签数据的价值。

    一种具有多输入多融合策略的双BiLSTM的语音情感识别方法

    公开(公告)号:CN110853680B

    公开(公告)日:2021-12-24

    申请号:CN201911072974.X

    申请日:2019-11-05

    Abstract: 本发明公布了一种面向语音情感分类的具有多输入多融合策略的双BiLSTM结构。首先,提取语音信号中的Mel谱特征和统计特征两种帧级特征,然后将两种特征同时输入两个双向LSTM网络进行学习,分别应用注意力机制和平均池化操作将两个双向LSTM的输出进行拼接得到基于各帧的注意加权和及平均的两种高级特征,最后,将这两种特征进行融合及批归一化处理后,使用softmax分类器进行语音情感识别。我们的DABL模型同时处理两种不同类型的特征,以便更好地了解情绪中的细微变化。在“EMO‑DB”数据集上的实验结果表明了本文方法的优越性。

    一种用于语音测谎的半监督加性噪声自编码器

    公开(公告)号:CN110009025A

    公开(公告)日:2019-07-12

    申请号:CN201910239533.8

    申请日:2019-03-27

    Abstract: 现有的语音谎言检测算法受制于难以获得足量的带标签语音数据,而现实中大量易得的无标签数据却被忽视,针对这一问题,本发明提出了一种用于语音测谎的半监督加性噪声自编码器,它包含有两层的编码和解码网络,以及一个分类器。该模型首先根据语音谎言的特征改变了网络中的激活函数,其次为了防止过拟合,在每一个网络层都增加了dropout,最后在编码输出部分直接连接了分类器使网络简洁高效。数据输入模型后,先经过编码网络提取特征,之后不仅进入解码网络进行重构,还要进入分类器进行分类。无标签数据保证了模型的泛化性,有标签数据可以保证提取到的特征更适合分类,因此,我们的模型充分利用了有标签和无标签数据的价值。

Patent Agency Ranking