专利检索 ap:("华为技术有限公司" OR "西安电子科技大学") AND inv:"马鸿飞" 第 1 页

1.

发明授权
一种音频编码方法和音频编码器失效

公开(公告)号：CN101740033B

公开(公告)日：2011-12-28

申请号：CN200810181909.6

申请日：2008-11-24

申请人： 华为技术有限公司 , 西安电子科技大学

发明人： 马鸿飞 , 柳巍 , 李倩 , 宋少鹏 , 许丽净

IPC分类号： G10L19/12 , G10L19/14

摘要： 本发明公开了一种音频编码方法和音频编码器方法。本发明实施例还提供相应的音频编码器。本发明技术方案由于利用线性预测LP和卷曲线性预测WLP的频率分辨特性非常接近人类听觉特性中的临界频带和掩蔽特性的特点，建立心理声学模型，获取到掩蔽门限，根据获取的掩蔽门限对音频信号进行编码，降低了建立心理声学模型的复杂度，易于实现，降低了心理声学模型在硬件实现的成本，降低了硬件的功率消耗。

2.

发明公开
生成心理声学模型的方法及装置失效

公开(公告)号：CN102169694A

公开(公告)日：2011-08-31

申请号：CN201010123999.0

申请日：2010-02-26

申请人： 华为技术有限公司 , 西安电子科技大学

发明人： 马鸿飞 , 郭泽华 , 夏雨 , 许丽净

IPC分类号： G10L19/02 , G10L19/00

摘要： 本发明公开了一种生成心理声学模型的方法及装置，属于音频处理技术领域。该方法包括：以修正离散余弦变换MDCT对输入的时域音频信号帧进行时频分析，得到MDCT频域参数；根据MDCT频域参数计算谱平坦测度函数、频谱局部最大主导分量扩展包络和频谱局部最小主导分量平均包络，并根据所述谱平坦测度函数、频谱局部最大主导分量扩展包络和频谱局部最小主导分量平均包络计算局部掩蔽门限；根据局部掩蔽门限，生成并输出全局掩蔽门限。本发明通过采用谱平坦测度函数计算局部掩蔽门限，实现对音频信号的音调掩蔽特性及非音调掩蔽特性进行区分处理，从而可以达到更合理地分配量化比特数，有效地提高量化效率的效果。

3.

发明授权
高频重建方法、编码装置和解码装置有权

公开(公告)号：CN101471072B

公开(公告)日：2012-01-25

申请号：CN200710305087.3

申请日：2007-12-27

申请人： 华为技术有限公司 , 西安电子科技大学

发明人： 马鸿飞 , 郭庆巍 , 张海波 , 张波 , 许丽净 , 张清 , 许剑峰 , 李伟 , 杜正中 , 胡晨 , 杨毅 , 苗磊 , 齐峰岩

IPC分类号： G10L19/00 , G10L19/14 , G10L21/02

CPC分类号： G10L21/038

摘要： 本发明实施例公开一种高频重建方法，包括：对音频或语音信号进行滤波处理得到低频子带和高频子带；确定频带复制策略；根据所述确定的频带复制策略获取所述低频子带与高频子带的相关性，为高频子带选择相关性大的低频子带作为最优复制频带，并输出包括选择频带的对应关系的高频重建参数信息。本发明还提供一种高频重建方法：接收包括选择频带的对应关系的高频重建参数信息，所述选择频带的对应关系具体为相关性大的低频子带和高频子带之间对应；在高频段根据所述包括选择频带的对应关系的高频重建参数信息将低频子带复制作为高频子带。相应的，本发明实施例提供一种编码模块和解码模块。本发明实施例提供的技术方案能够更准确的进行高频重建。

4.

发明公开
一种音频编码方法和音频编码器失效

公开(公告)号：CN101740033A

公开(公告)日：2010-06-16

申请号：CN200810181909.6

申请日：2008-11-24

申请人： 华为技术有限公司 , 西安电子科技大学

发明人： 马鸿飞 , 柳巍 , 李倩 , 宋少鹏 , 许丽净

IPC分类号： G10L19/12 , G10L19/14

摘要： 本发明公开了一种音频编码方法和音频编码器方法。本发明实施例还提供相应的音频编码器。本发明技术方案由于利用线性预测LP和卷曲线性预测WLP的频率分辨特性非常接近人类听觉特性中的临界频带和掩蔽特性的特点，建立心理声学模型，获取到掩蔽门限，根据获取的掩蔽门限对音频信号进行编码，降低了建立心理声学模型的复杂度，易于实现，降低了心理声学模型在硬件实现的成本，降低了硬件的功率消耗。

5.

发明授权
生成心理声学模型的方法及装置失效

公开(公告)号：CN102169694B

公开(公告)日：2012-10-17

申请号：CN201010123999.0

申请日：2010-02-26

申请人： 华为技术有限公司 , 西安电子科技大学

发明人： 马鸿飞 , 郭泽华 , 夏雨 , 许丽净

IPC分类号： G10L19/02 , G10L19/00

摘要： 本发明公开了一种生成心理声学模型的方法及装置，属于音频处理技术领域。该方法包括：以修正离散余弦变换MDCT对输入的时域音频信号帧进行时频分析，得到MDCT频域参数；根据MDCT频域参数计算谱平坦测度函数、频谱局部最大主导分量扩展包络和频谱局部最小主导分量平均包络，并根据所述谱平坦测度函数、频谱局部最大主导分量扩展包络和频谱局部最小主导分量平均包络计算局部掩蔽门限；根据局部掩蔽门限，生成并输出全局掩蔽门限。本发明通过采用谱平坦测度函数计算局部掩蔽门限，实现对音频信号的音调掩蔽特性及非音调掩蔽特性进行区分处理，从而可以达到更合理地分配量化比特数，有效地提高量化效率的效果。

6.

发明公开
高频重建方法、编码模块和解码模块有权

公开(公告)号：CN101471072A

公开(公告)日：2009-07-01

申请号：CN200710305087.3

申请日：2007-12-27

申请人： 华为技术有限公司 , 西安电子科技大学

发明人： 马鸿飞 , 郭庆巍 , 张海波 , 张波 , 许丽净 , 张清 , 许剑峰 , 李伟 , 杜正中 , 胡晨 , 杨毅 , 苗磊 , 齐峰岩

IPC分类号： G10L19/00 , G10L19/14 , G10L21/02

CPC分类号： G10L21/038

摘要： 本发明实施例公开一种高频重建方法，包括：对音频或语音信号进行滤波处理得到低频子带和高频子带；确定频带复制策略；根据所述确定的频带复制策略获取所述低频子带与高频子带的相关性，为高频子带选择相关性大的低频子带作为最优复制频带，并输出包括选择频带的对应关系的高频重建参数信息。本发明还提供一种高频重建方法：接收包括选择频带的对应关系的高频重建参数信息，所述选择频带的对应关系具体为相关性大的低频子带和高频子带之间对应；在高频段根据所述包括选择频带的对应关系的高频重建参数信息将低频子带复制作为高频子带。相应的，本发明实施例提供一种编码模块和解码模块。本发明实施例提供的技术方案能够更准确的进行高频重建。

7.

发明授权
一种基于MCLP的语音去混响方法及系统有权

公开(公告)号：CN113160842B

公开(公告)日：2024-04-09

申请号：CN202110247855.4

申请日：2021-03-06

申请人： 西安电子科技大学

发明人： 冯子成 , 马鸿飞

IPC分类号： G10L21/0208 , G10L21/0216 , G10L21/0232 , G10L21/0264

摘要： 本发明涉及语音信号处理技术领域，具体涉及一种基于MCLP的语音去混响方法及系统。该方法包括以下步骤：通过对采集的混响环境的混响语音进行分帧数据处理，获得当前帧的期望信号；获取期望信号的语音混响能量比和信噪估计值，代入几何谱减公式对混响语音进行谱减得到期望信号的第一功率谱密度；语音混响能量比与混响语音和混响分量的第一能量比值呈正相关关系，信噪估计值与期望语音和混响分量的第二能量比值呈正相关关系；根据第一功率谱密度获取去混响后的语音信号；存储当前帧的第一功率谱密度，并将其作为下一帧的历史第一功率谱密度，对下一帧的第一功率谱密度进行更新，直至获得所有去混响语音信号。本发明实施例能够得到更优质的去混响语音。

8.

发明授权
音频编解码方法失效

公开(公告)号：CN101436407B

公开(公告)日：2011-08-24

申请号：CN200810232760.X

申请日：2008-12-22

申请人： 西安电子科技大学

发明人： 马鸿飞 , 郭小川 , 熊静 , 徐雅俊 , 吴礼仲

IPC分类号： G10L19/00 , H03M7/30

摘要： 本发明公开了一种音频编解码方法，主要解决目前音频编码方法压缩比低、重构音频质量差的问题。采用时频变换与频域滤波方法或时域滤波与时频变换方法，分析音频信号，得到频域残差信号；将频域残差信号分割成低频和高频残差信号，分别对低频残差信号进行直接编码和对高频残差进行参数编码；然后用解码低频残差信号和解码高频残差重构高频残差信号；再将解码低频残差信号与重构高频残差信号重组得到重构频域残差信号；最后采用频域逆滤波与时频反变换的方法或时频反变换与时域逆滤波的方法，得到重构音频信号。本发明消除了频域残差信号中的多余度，提高了音频编码的压缩比、信道利用率和音频传输质量，用于多媒体通信和消费类电子设备。

9.

发明授权
音频编解码器失效

公开(公告)号：CN101436406B

公开(公告)日：2011-08-24

申请号：CN200810232759.7

申请日：2008-12-22

申请人： 西安电子科技大学

发明人： 马鸿飞 , 宋少鹏 , 李倩 , 柳巍 , 郝晓锋 , 彭凯 , 李双阳 , 张圣钦

IPC分类号： G10L19/00 , H03M7/30

摘要： 本发明公开了一种音频编码器和音频解码器。该编码器主要由时频分析单元、感知模型单元、感知参数编码和解码单元、频域感知滤波单元、残差分析与编码单元及合路单元电连接组成；该解码器主要由分路单元、感知参数编解码单元、残差解码与合成单元、频域感知逆滤波器单元和时频合成单元电连接组成。所述的音频编解码器在频域对音频信号进行压缩编码，其中残差分析与编码单元利用高频残差信号与低频残差信号之间的相关性，对高频残差信号进行参数编码；所述的残差解码与合成单元利用高频残差参数对高频残差进行复制和重构。本发明消除了频域残差信号中的多余度，提高了音频编码的压缩比、信道利用率和音频传输质量，用于多媒体通信和消费类电子设备。

10.

发明公开
一种基于MCLP的语音去混响方法及系统有权

公开(公告)号：CN113160842A

公开(公告)日：2021-07-23

申请号：CN202110247855.4

申请日：2021-03-06

申请人： 西安电子科技大学

发明人： 冯子成 , 马鸿飞

IPC分类号： G10L21/0208 , G10L21/0216 , G10L21/0232 , G10L21/0264

摘要： 本发明涉及语音信号处理技术领域，具体涉及一种基于MCLP的语音去混响方法及系统。该方法包括以下步骤：通过对采集的混响环境的混响语音进行分帧数据处理，获得当前帧的期望信号；获取期望信号的语音混响能量比和信噪估计值，代入几何谱减公式对混响语音进行谱减得到期望信号的第一功率谱密度；语音混响能量比与混响语音和混响分量的第一能量比值呈正相关关系，信噪估计值与期望语音和混响分量的第二能量比值呈正相关关系；根据第一功率谱密度获取去混响后的语音信号；存储当前帧的第一功率谱密度，并将其作为下一帧的历史第一功率谱密度，对下一帧的第一功率谱密度进行更新，直至获得所有去混响语音信号。本发明实施例能够得到更优质的去混响语音。

搜索结果

国家/区域

专利有效性

申请日

公布(公告)日

申请人

申请人所在国/区域

发明人

IPC

IPC部

IPC大类

IPC小类

IPC大组

IPC小组

外观分类