一种语音数据处理方法以及装置

    公开(公告)号:CN113362849B

    公开(公告)日:2024-08-30

    申请号:CN202010135093.4

    申请日:2020-03-02

    摘要: 本申请公开了一种音频数据处理方法以及装置,该方法包括:获得原始视频数据对应的原始音频数据;获得原始视频数据中的音频相关运动特征数据,音频相关运动特征数据指的是与原始视频数据对应的发声事件相关联的运动状态数据;根据音频相关运动特征数据,从原始音频数据中分析获得目标音频数据;按照预定的音频加工方式,对目标音频数据进行加工。通过使用本方法,可利用原始视频数据中的音频相关运动特征数据,从当前场景中的原始音频数据中获得对应的目标音频数据,并结合具体场景对该目标音频数据进行数据增强或数据抑制处理,该方法将图像数据应用到语音分离的场景中,使得语音分离的过程更加高效准确。