一种VDR语音端点检测方法
    1.
    发明公开

    公开(公告)号:CN116246664A

    公开(公告)日:2023-06-09

    申请号:CN202211635844.4

    申请日:2022-12-19

    Abstract: 本发明公开了一种VDR语音端点检测方法,包括:提取音频信号的特征信息,分别获取上述四个特征信息的一阶差分和二阶差分;将零填充后的特征图输入带有注意力机制的残差网络,提取特征图的复杂抽象特征;计算初步输出值为0和1对应的特征质心;搜索语音端点检测初步输出中持续时间为100ms以下的突变,并将其定义为短时突变,计算突变部分特征质心分别与整个音频文件的0和1两类判断结果的特征质心相似度;通过短时突变部分的特征质心相似度估计结果对VDR语音端点检测输出值进行更新,得到最终VDR语音端点检测的输出值。该方法避免短时端点检测突变,进而准确定位出VDR音频信号中语音位置。

    一种船舶VHF通信音频信号的语音增强方法

    公开(公告)号:CN117409793A

    公开(公告)日:2024-01-16

    申请号:CN202311175450.X

    申请日:2023-09-12

    Abstract: 本发明公开了一种船舶VHF通信音频信号的语音增强方法,包括:将音频信号进行短时傅里叶变换提取其实部和虚部分量;将实部和虚部分量输入至编码器中获得编码输出特征FK,将编码输出特征FK输入到复数Conformer模块中获得全局特征H,将全局特征H进行重塑得到重塑特征H',重塑特征H'和编码输出特征FK相拼接作为解码器的输入信息获得复数比例掩蔽GK,所述复数比例掩蔽GK为VHF通信音频信号的复数比例掩蔽,基于复数比例掩蔽GK获得增强的语音信号复数谱,对增强的语音信号复数谱作短时傅里叶逆变换得到增强的语音信号。本方法可充分利用时域、频域、绝对误差、相对误差、信号、噪声等信息进行权重更新,获得了更优的网络参数和增强效果。

Patent Agency Ranking