高阶Ambisonic音频编解码方法及装置

    公开(公告)号:CN110544484B

    公开(公告)日:2021-12-21

    申请号:CN201910898634.6

    申请日:2019-09-23

    发明人: 马士超

    摘要: 本发明提供一种高阶Ambisonic音频编解码方法及装置,编码包括:基于主成分分析法确定高阶Ambisonic音频的主成分矩阵,基于已训练的长短时记忆网络LSTM预测器对高阶Ambisonic音频进行预测,根据高阶Ambisonic音频、主成分矩阵和预测结果确定音频残差后对高阶Ambisonic音频进行编码;解码包括:将主成分矩阵投影至高维空间获得高维空间矩阵,基于LSTM预测器对主成分矩阵进行预测,根据高维空间矩阵、预测结果和音频残差获得解码后的高阶Ambisonic音频。该方案能减少存储高阶Ambisonic音频所需的参数,扩展其使用范围,使其适用于流媒体播放等实时性要求较高的场合。

    移动通信信号自适应混合压缩方法

    公开(公告)号:CN110380826B

    公开(公告)日:2021-09-28

    申请号:CN201910775050.X

    申请日:2019-08-21

    申请人: 苏州大学

    摘要: 本发明公开了一种移动通信信号自适应混合压缩和解压方法。本发明一种移动通信信号自适应混合压缩和解压方法,包括:移动通信信号自适应混合压缩方法主要分为线性预测编码LPC(Linear Predictive Coding,LPC)训练阶段、LPC和μ‑律对数压缩应用两个阶段,即在应用前需要按不同调制方式、功率及带宽采集相应的移动通信信号构造成一个训练数据集,利用其对移动通信信号自适应混合压缩方法进行训练,训练获得LPC参数表;在应用阶段采用训练所得的LPC参数表对移动通信信号进行自适应压缩和解压缩处理。本发明的有益效果:在提高传输容量的同时,能有效解决传统对数压缩方法所引起的解压信号底噪抬升的问题。

    编码器、解码器以及用于编码和解码的方法

    公开(公告)号:CN106415716B

    公开(公告)日:2020-03-17

    申请号:CN201580014310.1

    申请日:2015-03-03

    IPC分类号: G10L19/08 G10L19/13

    摘要: 一种用于将音频信号编码至数据流的编码器包括:预测器、因子分解器、变换器以及量化和编码阶段。预测器用于分析音频信号以获得描述音频信号的频谱模拟或音频信号的基频的预测系数,并使得音频信号服从取决于预测系数的分析滤波函数以输出音频信号的残差信号。因子分解器用于对由预测系数定义的合成滤波函数的自相关或协方差矩阵应用因子分解以获得经因子分解的矩阵。变换器用于基于经因子分解的矩阵对残差信号进行变换以获得变换的残差信号。量化和编码阶段用于对变换的残差信号进行量化以获得量化后的变换的残差信号或经编码的量化后的变换的残差信号。

    一种音频信号分类方法和装置

    公开(公告)号:CN104347067B

    公开(公告)日:2017-04-12

    申请号:CN201310339218.5

    申请日:2013-08-06

    发明人: 王喆

    IPC分类号: G10L15/08 G10L19/13 G10L25/51

    摘要: 本发明实施例公开了一种音频信号分类方法和装置,用于对输入的音频信号进行分类,该方法包括:根据当前音频帧的声音活动性,确定是否获得当前音频帧的频谱波动并存储于频谱波动存储器中,其中,所述频谱波动表示音频信号的频谱的能量波动;根据音频帧是否为敲击音乐或历史音频帧的活动性,更新频谱波动存储器中存储的频谱波动;根据频谱波动存储器中存储的频谱波动的部分或全部有效数据的统计量,将所述当前音频帧分类为语音帧或者音乐帧。

    一种基于频谱映射的端到端语音加解密系统

    公开(公告)号:CN106098073A

    公开(公告)日:2016-11-09

    申请号:CN201610343796.X

    申请日:2016-05-23

    申请人: 苏州大学

    IPC分类号: G10L19/13

    CPC分类号: G10L19/13

    摘要: 本发明公开了一种基于频谱映射的端到端语音加密系统,包括LPC分析模块,用于数字语音信号进行线性预测LPC分析得到LPC系数;LPC转LSF模块,用于将LPC系数转换为线性谱频率LSF系数;LSF映射模块,用于对LSF系数按照给定的密钥进行映射变换;LSF转LPC模块,用于将映射后的LSF系数转换为LPC系数;LPC滤波模块,用于将输入的数字语音信号滤波得到预测残差信号;LPC合成模块,用于根据映射变换后的LPC系数构造合成滤波器,预测残差信号通过构造的合成滤波器得到加密后的语音信号。保证了加密语音信号的语音特征,实现有效的语音加密。

    一种基于频谱映射的端到端的语音加解密方法

    公开(公告)号:CN106024000A

    公开(公告)日:2016-10-12

    申请号:CN201610343431.7

    申请日:2016-05-23

    申请人: 苏州大学

    IPC分类号: G10L19/13 H04L9/06

    摘要: 本发明公开了一种基于频谱映射的端到端语音加密方法,包括以下步骤:对数字语音信号进行线性预测(LPC)分析得到LPC系数;将LPC系数转换为线性谱频率(LSF)系数,对LSF系数按照给定的密钥进行映射变换,再将映射后的LSF系数转换为LPC系数,并构造出合成滤波器;原始数字语音信号通过线性预测,得到预测残差信号,最后将预测残差信号通过由映射变换后的LPC系数所构造的合成滤波器得到加密后的语音信号。保证了加密语音信号的语音特征,实现有效的语音加密。

    基于谐波加噪声模型的残差激励信号合成及语音转换方法

    公开(公告)号:CN102664003B

    公开(公告)日:2013-12-04

    申请号:CN201210121886.6

    申请日:2012-04-24

    摘要: 本发明公开一种基于谐波加噪声模型的残差激励信号合成及语音转换方法,属于语音信号处理领域,包含以下步骤:预处理与清浊音判断;谐波参数的提取;声道谱参数的计算;建立声道谱转换规则;特征参数的转换;残差激励的预测;语音合成与残差补偿。本发明在建立激励信号时,在经HNM分析提取出的浊音帧谐波信号的残差信号的基础上线性叠加上适度的HNM分析同时产生的剩余信号作为预测的激励源信号,从而有效的增强激励源中含有的说话人超音段特征,同时避免传统方法人为修改激励信号引入的失真;在合成阶段,在合成出的语音中再次逐帧叠加上适度的HNM分析出的目标浊音帧谐波信号的残差,使转换出的语音更具目标说话人个性,改善语音质量。

    一种窄带码流转换为宽带码流的转换方法

    公开(公告)号:CN103093757A

    公开(公告)日:2013-05-08

    申请号:CN201310033941.0

    申请日:2012-01-17

    IPC分类号: G10L19/07 G10L19/13

    摘要: 本发明公开了一种窄带码流转换为宽带码流的转换方法,所述的装置包括扩展单元和训练单元,所述的扩展单元包括窄带码流分离单元、窄带码流解析单元、窄带能量计算单元、码书映射单元、函数映射单元、高频时域包络及频域包络编码单元、高频能量编码单元、码流合成单元以及高频能量解码单元。所述的方法包括以下步骤:窄带码流解析;码书映射;窄带能量计算;函数映射;编码和码流合成。本发明第一次实现了将G.729编码得到的窄带码流扩展成可以作为G.729.1解码器输入的宽带码流,可以直接将现有电话通信网络传来的窄带码流直接通过G.729.1解码输出得到宽带语音,实现了宽带终端对窄带终端的兼容。

    用于机器人的语音增强方法、装置及机器人

    公开(公告)号:CN114974275A

    公开(公告)日:2022-08-30

    申请号:CN202110192265.6

    申请日:2021-02-18

    发明人: 李炯亮

    摘要: 本申请关于一种用于机器人的语音增强方法、装置和机器人,具体实现方法包括:获取机器人采集的语音信息,并根据语音信息生成语音信息的声道参数,对语音信息进行第一增强以生成初始增强语音信息,进而,根据声道参数和初始增强语音信息进行第二增强生成增强语音信息,通过对机器人采集的语音信息进行增强,使得受污染的低频信息得以恢复,并将衰减的高频信息补全,提高了语音信息的质量,进而提高了语音识别的准确度。