信号处理方法、装置、计算机设备、存储介质及程序产品

    公开(公告)号:CN117334204A

    公开(公告)日:2024-01-02

    申请号:CN202210739202.2

    申请日:2022-06-24

    发明人: 梁俊斌

    IPC分类号: G10L19/16 G10L19/07

    摘要: 本申请提供一种信号处理方法、装置、计算机设备、存储介质及程序产品,涉及语音技术、人工智能、智慧交通等技术领域。通基于该目标语音信号的带宽、以及预设的目标频率阈值,将该目标语音信号分解为至少两个子带信号;并分别通过第一语音编码器,获取语谱频率高于目标频率阈值的第一子带信号的第一编码码流,可得到低码率的编码码流,降低了低质量需求的高频子带信号所需的传输带宽;以及通过第二语音编码器,获取语谱频率不高于目标频率阈值的第二子带信号的第二编码码流,得到高质量的编码变流,保证了具备大部分信息量的第二子带信号的编码质量,从而在保证编码质量的前提下,尽可能的降低了所需的传输成本。

    声码器的训练方法和装置及合成音频信号的方法和声码器

    公开(公告)号:CN113436603A

    公开(公告)日:2021-09-24

    申请号:CN202110717102.5

    申请日:2021-06-28

    摘要: 提供了一种声码器的训练方法和装置及合成音频信号的方法和声码器,其特征在于,所述声码器的训练方法包括:基于音频信号获取第一低频时域信号和第一高频时域信号;基于第一低频时域信号获取低频频域特征,并基于第一高频时域信号获取高频频域特征;基于低频频域特征,通过声码器的第一网络来获取第二低频时域信号;基于高频频域特征和第二低频时域信号,通过声码器的第二网络来获取第二高频时域信号;基于第二低频时域信号和第二高频时域信号来获取损失函数;基于所述损失函数来训练声码器的第一网络和第二网络。

    语音处理方法及其装置
    4.
    发明公开

    公开(公告)号:CN112562699A

    公开(公告)日:2021-03-26

    申请号:CN201910918220.5

    申请日:2019-09-26

    摘要: 本发明提供一种语音处理方法及其装置。所述方法包括:在多激励线性预测(Multi Excitation Linear Prediction,MELP)语音编码系统中,取得语音取样信号框,并估计语音取样信号框的信号质量;基于信号质量决定线性预测编码(linear prediction coding,LPC)电路所使用的特定LPC阶数;控制LPC电路基于特定LPC阶数将语音取样信号框转换为线谱对参数;以线谱对参数取代语音取样信号框的语音信号频谱,以产生预测语音信号;以及基于预测语音信号进行MELP语音编码系统的语音编码操作及信号合成操作。

    一种基于线性预测残差分类量化的多描述语音编解码方法和系统

    公开(公告)号:CN108109629A

    公开(公告)日:2018-06-01

    申请号:CN201611033175.8

    申请日:2016-11-18

    申请人: 南京大学

    发明人: 林志斌 邱小军

    摘要: 所述一种基于线性预测残差分类量化的多描述语音编码、解码方法及系统,将待编码语音流经过短时预测分析、长时预测分析获取短时预测参数、长时预测参数和时域预测残差信号,并将残差信号分为多个多维编码矢量,计算各个编码矢量能量包络进行比特分配,并对各编码矢量的时域系数进行双循环矢量量化和编码;将短时预测参数、长时预测参数交织多描述分组打包,预测残差量化指数和各量化编码信号的矢量量化值的各编码比特进行复用打包。