一种语音分离方法、装置、电子设备和存储介质

    公开(公告)号:CN114783459B

    公开(公告)日:2024-04-09

    申请号:CN202210314598.6

    申请日:2022-03-28

    发明人: 罗艺 李凯

    摘要: 本申请涉及计算机技术领域,尤其涉及语音处理技术领域,提供一种语音分离方法、装置、电子设备和存储介质,用以提高语音分离的准确性。其中,方法包括:获取待分离语音数据;对待分离语音数据进行编码,获得对应的编码结果,并对编码结果进行语音分离操作,获得至少一个目标声源各自对应的语音特征和相位移动特征;基于获得的至少一个相位移动特征,分别对预设的信号解码参数集进行参数重构,获得相应的目标信号解码参数集;分别采用获得的至少一个目标信号解码参数集,对相应的语音特征进行解码,获得对应的目标声源对应的重建语音信号。由于本申请通过相位移动提高中高频信号的建模能力,几乎没有额外增加参数量或复杂度,可有效提高分离性能。

    一种语音分离方法、装置、电子设备和存储介质

    公开(公告)号:CN114783459A

    公开(公告)日:2022-07-22

    申请号:CN202210314598.6

    申请日:2022-03-28

    发明人: 罗艺 李凯

    摘要: 本申请涉及计算机技术领域,尤其涉及语音处理技术领域,提供一种语音分离方法、装置、电子设备和存储介质,用以提高语音分离的准确性。其中,方法包括:获取待分离语音数据;对待分离语音数据进行编码,获得对应的编码结果,并对编码结果进行语音分离操作,获得至少一个目标声源各自对应的语音特征和相位移动特征;基于获得的至少一个相位移动特征,分别对预设的信号解码参数集进行参数重构,获得相应的目标信号解码参数集;分别采用获得的至少一个目标信号解码参数集,对相应的语音特征进行解码,获得对应的目标声源对应的重建语音信号。由于本申请通过相位移动提高中高频信号的建模能力,几乎没有额外增加参数量或复杂度,可有效提高分离性能。

    音频分离的方法、装置、设备、存储介质和程序产品

    公开(公告)号:CN114512141A

    公开(公告)日:2022-05-17

    申请号:CN202210121128.8

    申请日:2022-02-09

    摘要: 本申请公开了一种音频分离的方法、装置、设备、存储介质和程序产品,属于音频处理领域。所述方法包括:获取采集的音频数据;基于所述音频数据和经过训练的音频分离模型,确定多个子音频数据;基于所述多个子音频数据和经过训练的音频分组模型,确定每个子音频数据对应的分组信息,其中,所述分组信息用于指示对应的子音频数据与至少一个声源对象的关联关系;基于所述每个子音频数据和所述每个子音频数据对应的分组信息,确定每个声源对象对应的声源对象音频数据。采用本申请,可以提高音频识别的准确度。

    音频分离方法、音频分离模型的训练方法、装置及设备

    公开(公告)号:CN114446316A

    公开(公告)日:2022-05-06

    申请号:CN202210101338.0

    申请日:2022-01-27

    发明人: 罗艺 李凯

    IPC分类号: G10L21/0272 G10L25/30

    摘要: 本申请公开了一种音频分离方法、音频分离模型的训练方法、装置及设备,属于音频处理技术领域。所述方法包括:获取待处理的目标音频数据,目标音频数据中包括至少一个声源;确定目标音频数据的多个时频单元,时频单元用于表征目标音频数据中的声学信息;对于多个时频单元中的目标时频单元,基于目标时频单元对应的时频单元集合,确定目标时频单元对应的实值遮蔽信息;根据时频单元集合和实值遮蔽信息,确定目标时频单元对应的声源信息;基于多个时频单元分别对应的声源信息,从目标音频数据中确定目标声源目标音频数据。通过上述方法,在基本不改变音频分离过程的计算量的同时,能够提高音频分离模型的分离准确度性能。

    视频的滤波方法和装置、存储介质、电子装置

    公开(公告)号:CN110445951B

    公开(公告)日:2022-02-22

    申请号:CN201810411623.6

    申请日:2018-05-02

    发明人: 夏珍 李凯 汪青

    IPC分类号: H04N5/21 G06T5/00

    摘要: 本发明公开了一种视频的滤波方法和装置、存储介质、电子装置。其中,该方法包括:获取第一视频帧和第二视频帧,其中,第一视频帧为目标视频流中位于第一播放时刻的视频帧,第二视频帧为目标视频流中位于第二播放时刻的视频帧,目标视频流为图像采集设备采集到的视频流;基于第一视频帧和第二视频帧确定目标运动类型,其中,目标运动类型为图像采集设备的取景区域在第一播放时刻与第二播放时刻之间进行运动的运动类型;控制第一滤波器按照目标运动类型对第三视频帧进行滤波,其中,第三视频帧为目标视频流中位于第三播放时刻的视频帧,第三播放时刻晚于第一播放时刻和第二播放时刻。本发明解决了相关技术中进行降噪处理的实时性较差的技术问题。

    视频处理方法和装置
    10.
    发明授权

    公开(公告)号:CN108337465B

    公开(公告)日:2021-05-14

    申请号:CN201710071869.9

    申请日:2017-02-09

    发明人: 李凯

    IPC分类号: H04N7/14 H04N5/262

    摘要: 本发明公开了一种视频处理方法和装置。其中,该方法包括:获取用于指示第一终端的GPU性能的第一参数和用于指示第一终端的CPU性能的第二参数;根据第一参数和/或第二参数控制第一终端的GPU或者CPU对第一视频进行滤镜处理,得到第二视频,其中,第一视频为第一终端实时录制的视频;控制第一终端向第二终端发送第二视频,其中,第二终端用于实时显示第二视频。本发明解决了现有技术实时视频通话过程中无法根据终端的性能对视频进行相应的滤镜处理的技术问题。