-
公开(公告)号:CN117334204A
公开(公告)日:2024-01-02
申请号:CN202210739202.2
申请日:2022-06-24
申请人: 腾讯科技(深圳)有限公司
发明人: 梁俊斌
摘要: 本申请提供一种信号处理方法、装置、计算机设备、存储介质及程序产品,涉及语音技术、人工智能、智慧交通等技术领域。通基于该目标语音信号的带宽、以及预设的目标频率阈值,将该目标语音信号分解为至少两个子带信号;并分别通过第一语音编码器,获取语谱频率高于目标频率阈值的第一子带信号的第一编码码流,可得到低码率的编码码流,降低了低质量需求的高频子带信号所需的传输带宽;以及通过第二语音编码器,获取语谱频率不高于目标频率阈值的第二子带信号的第二编码码流,得到高质量的编码变流,保证了具备大部分信息量的第二子带信号的编码质量,从而在保证编码质量的前提下,尽可能的降低了所需的传输成本。
-
-
公开(公告)号:CN113436603A
公开(公告)日:2021-09-24
申请号:CN202110717102.5
申请日:2021-06-28
申请人: 北京达佳互联信息技术有限公司
摘要: 提供了一种声码器的训练方法和装置及合成音频信号的方法和声码器,其特征在于,所述声码器的训练方法包括:基于音频信号获取第一低频时域信号和第一高频时域信号;基于第一低频时域信号获取低频频域特征,并基于第一高频时域信号获取高频频域特征;基于低频频域特征,通过声码器的第一网络来获取第二低频时域信号;基于高频频域特征和第二低频时域信号,通过声码器的第二网络来获取第二高频时域信号;基于第二低频时域信号和第二高频时域信号来获取损失函数;基于所述损失函数来训练声码器的第一网络和第二网络。
-
公开(公告)号:CN112562699A
公开(公告)日:2021-03-26
申请号:CN201910918220.5
申请日:2019-09-26
申请人: 宏碁股份有限公司
IPC分类号: G10L19/07 , G10L19/087 , G10L25/60
摘要: 本发明提供一种语音处理方法及其装置。所述方法包括:在多激励线性预测(Multi Excitation Linear Prediction,MELP)语音编码系统中,取得语音取样信号框,并估计语音取样信号框的信号质量;基于信号质量决定线性预测编码(linear prediction coding,LPC)电路所使用的特定LPC阶数;控制LPC电路基于特定LPC阶数将语音取样信号框转换为线谱对参数;以线谱对参数取代语音取样信号框的语音信号频谱,以产生预测语音信号;以及基于预测语音信号进行MELP语音编码系统的语音编码操作及信号合成操作。
-
公开(公告)号:CN111312265A
公开(公告)日:2020-06-19
申请号:CN202010115361.6
申请日:2015-01-15
申请人: 三星电子株式会社
IPC分类号: G10L19/087 , G10L19/032 , G10L19/06 , G10L19/07 , G10L19/12 , G10L25/15 , G10L19/00
摘要: 一种对线性预测编码系数进行量化的加权函数确定装置和方法,所述方法可包括以下步骤:从输入信号的线性预测编码(LPC)系数获得线谱频率(LSF)系数和导抗谱频率(ISF)系数中的任何一个;并且通过将基于频谱分析信息的第一加权函数和基于LSF系数或ISF系数的位置信息的第二加权函数组合来确定加权函数。
-
公开(公告)号:CN107430869B
公开(公告)日:2020-06-12
申请号:CN201680007107.6
申请日:2016-01-27
申请人: 日本电信电话株式会社 , 国立大学法人东京大学
IPC分类号: G10L25/03 , G10L25/18 , G10L19/038 , G10L19/07 , G10L19/02 , G10L19/16 , H03M7/30 , G10L25/21
摘要: 参数决定装置具备:频谱包络估计单元(42),将参数η0及参数η设为正数,使用通过规定的方法而决定的参数η0,将与时序信号对应的频域样本串的绝对值的η0次方视为功率谱而进行频谱包络的估计;白色化频谱序列生成单元(43),得到将频域样本串除以频谱包络后的序列即白色化频谱序列;以及参数取得单元(44),求得以参数η为形状参数的一般化高斯分布近似白色化频谱序列的直方图的参数η。
-
公开(公告)号:CN105393303B
公开(公告)日:2019-07-16
申请号:CN201480041188.2
申请日:2014-10-10
申请人: 株式会社NTT都科摩
IPC分类号: G10L19/005 , G10L19/07
摘要: 音频信号处理装置具有:不连续估计器,其对在产生分组丢失后第一个正常接收到的音频分组,估计由于音频分组解码的结果所得到的解码音频的振幅急剧增大而产生的不连续性;以及不连续修正器,其修正解码音频的不连续性。
-
公开(公告)号:CN105074820B
公开(公告)日:2019-01-15
申请号:CN201380073344.9
申请日:2013-09-03
申请人: 高通股份有限公司
发明人: 维韦克·拉金德朗 , 苏巴辛格哈·夏敏达·苏巴辛格哈 , 文卡特什·克里希南
IPC分类号: G10L19/07 , G10L19/005
摘要: 本发明描述一种用于通过电子装置确定内插因数组的方法。所述方法包含基于当前帧特性和先前帧特性确定值。所述方法也包含确定所述值是否在一范围之外。所述方法进一步包含在所述值在所述范围之外的情况下基于所述值和预测模式指示符确定内插因数组。所述方法额外包含合成语音信号。
-
公开(公告)号:CN108109629A
公开(公告)日:2018-06-01
申请号:CN201611033175.8
申请日:2016-11-18
申请人: 南京大学
IPC分类号: G10L19/02 , G10L19/032 , G10L19/038 , G10L19/07
摘要: 所述一种基于线性预测残差分类量化的多描述语音编码、解码方法及系统,将待编码语音流经过短时预测分析、长时预测分析获取短时预测参数、长时预测参数和时域预测残差信号,并将残差信号分为多个多维编码矢量,计算各个编码矢量能量包络进行比特分配,并对各编码矢量的时域系数进行双循环矢量量化和编码;将短时预测参数、长时预测参数交织多描述分组打包,预测残差量化指数和各量化编码信号的矢量量化值的各编码比特进行复用打包。
-
公开(公告)号:CN107180644A
公开(公告)日:2017-09-19
申请号:CN201710165066.X
申请日:2017-03-10
申请人: GN瑞声达A/S
发明人: M·S·卡瓦莱卡拉姆 , M·G·克里斯坦森 , F·格兰 , J·B·博尔特
IPC分类号: G10L21/0208 , G10L21/0216 , G10L21/0264 , G10L19/00 , G10L19/07 , G10L19/26
CPC分类号: H04R25/505 , G10L21/0208 , G10L25/12 , H04R1/1083 , H04R25/552 , H04R2201/107 , H04R2225/43 , G10L19/00 , G10L19/07 , G10L19/26 , G10L21/0216 , G10L21/0264 , G10L2019/0001 , G10L2021/02165
摘要: 本申请涉及使用基于码本的方法的基于卡尔曼滤波的语音增强。本发明公开用于增强语音可懂度的方法和听力设备,听力设备包括用于提供包括语音信号和噪声信号的输入信号的输入变换器;配置为用于处理输入信号的处理单元;耦合到处理单元的输出用于将来自处理单元的输出信号转换成音频输出信号的声学输出变换器;其中处理单元配置为用于对输入信号执行基于码本的方法处理,其中处理单元配置为用于基于基于码本的方法处理确定输入信号的一个或多个参数,其中处理单元配置为用于使用所确定的一个或多个参数执行输入信号的卡尔曼滤波,其中处理单元配置为使得输出信号由于卡尔曼滤波而增强了语音可懂度。
-
-
-
-
-
-
-
-
-