音频降噪方法、装置、电子设备及可读存储介质

    公开(公告)号:CN115995234A

    公开(公告)日:2023-04-21

    申请号:CN202211028582.5

    申请日:2022-08-25

    发明人: 王少华

    摘要: 本申请公开了一种音频降噪方法、装置、电子设备及可读存储介质,属于音频处理技术领域。该方法包括:计算目标音频信号对应的目标长时信噪比和目标长时平稳度指标,所述目标长时平稳度指标用于指示目标音频信号中噪声的平稳程度;根据目标长时信噪比和目标长时平稳度指标,确定目标音频信号对应的目标声学场景;基于目标声学场景,对目标音频信号进行降噪处理。

    音频处理方法及其装置
    2.
    发明公开

    公开(公告)号:CN115862651A

    公开(公告)日:2023-03-28

    申请号:CN202211436870.4

    申请日:2022-11-16

    发明人: 王少华

    摘要: 本申请公开了一种音频处理方法及其装置,属于通信技术领域。包括:获取音频信号,音频信号包括电子设备的不同麦克风采集的第一音频子信号和第二音频子信号;根据音频信号中每个音频频点对应的语音信号存在概率,构建音频信号对应的语音协方差矩阵和噪声协方差矩阵;根据语音协方差矩阵和噪声协方差矩阵获得音频信号对应的混合矩阵,并对混合矩阵求逆,确定音频信号的解混矩阵;其中,混合矩阵包括音频信号中语音信号通道对应的第一空间传递函数和音频信号中噪声信号通道对应的第二空间传递函数;根据解混矩阵和音频信号,输出第一音频子信号对应的第一语音信号、第一噪声信号、第二音频子信号对应的第二语音信号、第二噪声信号。

    模型训练方法、装置、电子设备及介质

    公开(公告)号:CN116306889A

    公开(公告)日:2023-06-23

    申请号:CN202211097756.3

    申请日:2022-09-08

    IPC分类号: G06N3/084 G06N3/0464

    摘要: 本申请公开了一种模型训练方法、装置、电子设备及介质,属于人工智能领域。该模型训练方法,包括:将第一音频输入至第一神经网络模型,得到所述第一神经网络模型输出的第二音频;将所述第二音频输入至第二神经网络模型,得到所述第二神经网络模型输出的第三音频;基于所述第一音频对应的标签和所述第二音频确定第一损失函数,基于所述第一音频对应的标签和所述第三音频确定第二损失函数;基于所述第一损失函数和所述第二损失函数,更新所述第一神经网络模型。

    基音检测方法、装置、终端设备和介质

    公开(公告)号:CN110728990B

    公开(公告)日:2022-04-05

    申请号:CN201910906963.0

    申请日:2019-09-24

    发明人: 王少华 申厚拯

    IPC分类号: G10L25/03 G10L25/60

    摘要: 本发明公开了一种基音检测方法、装置、终端设备和介质。该方法包括:获取时域上的待检测语音信号;确定待检测语音信号对应的目标频域信号;基于目标频域信号确定M个基音周期侯选值;基于M个余弦信号从M个基音周期候选值中确定待检测语音信号的基音周期;M个余弦信号是利用M个基音周期侯选值生成的,M个余弦信号的周期分别为M个基音周期侯选值,且一个余弦信号的周期对应一个基音周期侯选值,M为大于等于2的整数。根据本发明实施例,能够提高基音检测的准确性。

    音频信号处理方法及电子设备
    5.
    发明公开

    公开(公告)号:CN111477243A

    公开(公告)日:2020-07-31

    申请号:CN202010301746.1

    申请日:2020-04-16

    发明人: 王少华

    IPC分类号: G10L21/0232 G10L21/0264

    摘要: 本发明实施例提供了一种音频信号处理方法及电子设备。所述方法包括:获取第一音频信号的第一能量值以及第二能量值,确定所述第一能量值以及所述第二能量值之间的能量差值;根据所述能量差值以及预设的判断阈值,确定所述第一音频信号为语音信号的先验概率;所述判断阈值为根据所述第一音频信号的前一帧音频信号确定的;根据所述先验概率,确定所述第一音频信号的噪声能量以及维纳增益;根据所述维纳增益,确定第一音频信号增强后的目标频域信号,将所述目标频域信号转换为目标时域信号;所述目标时域信号为所述第一音频信号增强后的音频信号。本发明实施例解决了现有技术中,语音增强方案容易引入残留噪声,且损失一些弱语音信号的问题。

    基音检测方法、装置、终端设备和介质

    公开(公告)号:CN110728990A

    公开(公告)日:2020-01-24

    申请号:CN201910906963.0

    申请日:2019-09-24

    发明人: 王少华 申厚拯

    IPC分类号: G10L25/03 G10L25/60

    摘要: 本发明公开了一种基音检测方法、装置、终端设备和介质。该方法包括:获取时域上的待检测语音信号;确定待检测语音信号对应的目标频域信号;基于目标频域信号确定M个基音周期侯选值;基于M个余弦信号从M个基音周期候选值中确定待检测语音信号的基音周期;M个余弦信号是利用M个基音周期侯选值生成的,M个余弦信号的周期分别为M个基音周期侯选值,且一个余弦信号的周期对应一个基音周期侯选值,M为大于等于2的整数。根据本发明实施例,能够提高基音检测的准确性。

    音频信号处理方法及电子设备

    公开(公告)号:CN111477243B

    公开(公告)日:2023-05-23

    申请号:CN202010301746.1

    申请日:2020-04-16

    发明人: 王少华

    IPC分类号: G10L21/0232 G10L21/0264

    摘要: 本发明实施例提供了一种音频信号处理方法及电子设备。所述方法包括:获取第一音频信号的第一能量值以及第二能量值,确定所述第一能量值以及所述第二能量值之间的能量差值;根据所述能量差值以及预设的判断阈值,确定所述第一音频信号为语音信号的先验概率;所述判断阈值为根据所述第一音频信号的前一帧音频信号确定的;根据所述先验概率,确定所述第一音频信号的噪声能量以及维纳增益;根据所述维纳增益,确定第一音频信号增强后的目标频域信号,将所述目标频域信号转换为目标时域信号;所述目标时域信号为所述第一音频信号增强后的音频信号。本发明实施例解决了现有技术中,语音增强方案容易引入残留噪声,且损失一些弱语音信号的问题。

    音频处理方法、装置、电子设备及存储介质

    公开(公告)号:CN111654572A

    公开(公告)日:2020-09-11

    申请号:CN202010458758.5

    申请日:2020-05-27

    发明人: 王少华 倪忠

    IPC分类号: H04M1/20 G06N3/08 G10L21/0208

    摘要: 本申请公开了一种音频处理方法、装置、电子设备及存储介质,属于通信技术领域。该方法主要包括取通话过程中的音频信号;将音频信号输入到目标深度学习网络模型,得到音频信号的音频来源的数量信息,目标深度学习网络模型由第一上行音频信号和第一下行音频信号训练得到;根据音频信号和数量信息,对音频信号中的干扰音频信号进行消除处理,得到目标音频信号。能够解决语音通讯过程中出现回声的问题。

    一种降噪方法及电子设备

    公开(公告)号:CN110839108A

    公开(公告)日:2020-02-25

    申请号:CN201911077865.7

    申请日:2019-11-06

    发明人: 蒋国珠 王少华

    IPC分类号: H04M1/725 H04M1/19

    摘要: 本发明实施例提供了一种降噪方法及电子设备,在通话过程中,检测电子设备的环境噪音参数;在环境噪音参数满足预设条件的情况下,调用光学传感器获取关于用户的第一音频信号;调用麦克风获取用户的第二音频信号;依据第一音频信号对第二音频信号进行降噪处理,生成目标音频信号,能够采用光学传感器获取较为准确的第一音频信号,对第二音频信号进行降噪,从而避免出现常规双麦降噪方案所遇到的两个麦克风堆叠环境不一致或者两个麦克风隔离度差等问题所带来的降噪效果差的问题。提高通话质量,提升用户的使用体验。

    一种语音活动检测方法、移动终端

    公开(公告)号:CN109754823A

    公开(公告)日:2019-05-14

    申请号:CN201910143186.9

    申请日:2019-02-26

    发明人: 王少华 申厚拯

    IPC分类号: G10L25/78 G10L25/18 G10L25/84

    摘要: 本发明提供了一种语音活动检测方法和移动终端,涉及音频信号处理技术领域。所述方法,包括:获取目标音频数据中当前帧在预设的多个频域子带中的特征值;基于所述特征值,通过预设的分类方法确定所述当前帧的语音后验概率;在所述语音后验概率大于等于预设的语音门限概率的情况下,确认所述当前帧为语音帧。能够提高语音活动检测的准确性以及实用性。