一种音视频录制方法、装置及储存介质

    公开(公告)号:CN117880731A

    公开(公告)日:2024-04-12

    申请号:CN202211247669.1

    申请日:2022-10-12

    Abstract: 本公开是关于一种音视频录制方法、装置及储存介质。音视频录制方法包括:获取音频数据,并获取视频数据;确定视频数据中所包括声源相对录制设备的声源空间位置信息;基于声源空间位置信息,融合音频数据和视频数据,得到融合后的音视频信息;基于融合后的音视频信息,生成音视频录制文件。通过本公开能够使录制设备在录制空间音视频的过程中实时追踪并获取声源的空间位置信息,并根据此信息对音频数据进行音频聚焦得到聚焦后音频信号,利用该信号进行空间音频编码最终得到空间音视频文件,这将有效提升录制设备在音视频录制过程中的声源追踪能力,增强空间音视频的立体感,使用户获得环绕式聆听体验。

    音频聚焦方法及装置、存储介质及电子设备

    公开(公告)号:CN115589566A

    公开(公告)日:2023-01-10

    申请号:CN202211180723.5

    申请日:2022-09-26

    Abstract: 本公开提供一种音频聚焦方法及装置、存储介质及电子设备,其中,所述音频聚焦方法包括:确定使用所述电子设备进行通话的用户相对于所述电子设备的目标空间方位;确定所述电子设备上的至少一个麦克风所接收到的目标阵列信号;根据所述目标阵列信号,聚焦得到来自所述目标空间方位的音频信号。本公开实施例提供的音频聚焦方法,通过多个麦克风接收到的阵列信号来聚焦得到所述目标空间方位的音频信号,可以提高聚焦后的音频信号的准确性。

    图像处理方法、装置、电子设备、存储介质及芯片

    公开(公告)号:CN119902671A

    公开(公告)日:2025-04-29

    申请号:CN202311404445.1

    申请日:2023-10-26

    Inventor: 余俊飞

    Abstract: 本公开涉及一种图像处理方法、装置、电子设备、存储介质及芯片,该方法包括:获取针对目标图像的编辑信息,编辑信息包括语音信息或文本信息;根据编辑信息对目标图像进行编辑。能够实现根据用户的语音信息或文本信息对目标图像进行编辑的功能,提升图像编辑方式多样性和灵活性,使编辑操作更加简便、直观和高效,从而提升了用户的操作效率和体验。

    声音事件定位方法、装置、家电设备及存储介质

    公开(公告)号:CN116930866A

    公开(公告)日:2023-10-24

    申请号:CN202210337682.X

    申请日:2022-03-31

    Abstract: 本公开提出一种声音事件定位方法、装置、家电设备及存储介质,该方法包括:获取场景声音信号,并确定声音采集装置的位置信息,其中,所述声音采集装置基于所述位置信息采集所述场景声音信号,再根据所述场景声音信号,确定目标声音事件的声音信息,以及根据所述位置信息和所述声音信息,对所述目标声音事件进行定位。通过本公开,能够实现结合声音采集装置的位置信息和目标声音事件的声音信息,对目标声音事件进行快速定位,从而能够有效地提升声音事件的定位效率,有效地提升声音事件的定位效果。

    图像生成方法及其装置
    5.
    发明公开

    公开(公告)号:CN119904535A

    公开(公告)日:2025-04-29

    申请号:CN202311402091.7

    申请日:2023-10-26

    Abstract: 本公开是关于一种图像生成方法及其装置。其中方法包括:提供图像选择界面;图像选择界面用于获取被选择的待处理图像;显示第一对象的目标形象图像和/或至少一组主题场景的形象创作图像;第一对象的目标形象图像为基于第一对象的个体形象模型生成的图像,每组主题场景的形象创作图像为基于对应的主题模版模型结合个体形象模型生成的图像,个体形象模型为基于待处理图像训练得到的模型。通过实施本公开实施,可以使得用户可以快速获得目标形象图像及其形象创作图像,可以提高真人写真效果的稳定性和质量。

    一种空间音频录制方法、装置及存储介质

    公开(公告)号:CN117880732A

    公开(公告)日:2024-04-12

    申请号:CN202211250667.8

    申请日:2022-10-12

    Abstract: 本公开是关于一种空间音频录制方法、装置及存储介质。空间音频录制装置包括:包括:音频数据采集模块,用于获取音频数据;音频信号滤波模块,用于对音频数据进行滤波处理;声源角度测算模块,用于对音频数据采集模块获取的音频数据进行预处理,并基于预处理后的音频数据确定音频数据的声源角度;空间音频渲染模块,用于通过声源角度测算模块确定的音频数据的声源角度和音频信号滤波模块滤波处理后的音频数据,进行空间音频渲染,得到空间音频数据。通过本公开能够使音响在录制空间音频的过程中实时录制音频并获取声源的空间角度信息,从而提升智能音响在空间音频录制过程中的环境适应性,大幅增强空间音频的立体感,最终使用户获得逼真的环绕式聆听体验。

    一种音效控制方法、装置及存储介质

    公开(公告)号:CN117501363A

    公开(公告)日:2024-02-02

    申请号:CN202280004323.0

    申请日:2022-05-30

    Abstract: 本公开是关于一种音效控制方法、装置及存储介质。其中,音效控制方法包括:获取第一音频信号、第二音频信号以及视频信号,所述第一音频信号为所述终端中待播放视频中的音频信号,所述第二音频信号至少包括所述第一音频信号以及环境音频信号,所述视频信号为所述待播放视频中的视频信号;基于所述第二音频信号以及所述视频信号,确定目标音效控制信息;按照所述目标音效控制信息控制所述终端播放所述第一音频信号的音效。通过本公开的音效控制方法,可以提升智能设备在音效控制方面的环境适应性,使用户获得最佳的视听体验。

Patent Agency Ranking