-
公开(公告)号:CN118057838A
公开(公告)日:2024-05-21
申请号:CN202211447613.0
申请日:2022-11-18
Applicant: 北京小米移动软件有限公司
Inventor: 谢福仕
IPC: H04R3/00
Abstract: 本公开是关于一种音频信号处理方法、装置、介质及电子设备。音频信号处理方法包括:确定初始音频信号对应的初始频域信息,初始频域信息包括第一预设频段内的第一频域信息和第二预设频段内的第二频域信息;基于预设的降噪模型以及第一频域信息,确定第一降噪信息;根据第一降噪信息,确定第二频域信息的第二降噪信息;根据第一降噪信息和第二降噪信息,对初始频域信息进行处理得到目标音频信号对应的目标频域信息。无需对第二频域信息进行复杂的降噪信息的确定过程,降低了音频信号处理过程的复杂度,从而提高了音频信号处理的效率。
-
公开(公告)号:CN119919534A
公开(公告)日:2025-05-02
申请号:CN202311432698.X
申请日:2023-10-31
Applicant: 北京小米移动软件有限公司
Abstract: 本公开是关于一种图像绘制方法、图像绘制装置及存储介质。图像绘制方法包括:获取第一图像;响应于检测到在所述第一图像上选择区域图像的操作,调用图像风格模型,对所述区域图像进行风格化处理,得到第二图像;在所述第一图像的所述区域图像处融合所述第二图像,得到目标图像。通过本公开,实现图像的局部创作,并实现局部编辑风格与原图风格相同,满足了用户的喜好与需求。
-
公开(公告)号:CN119479671A
公开(公告)日:2025-02-18
申请号:CN202311001653.7
申请日:2023-08-09
Applicant: 北京小米移动软件有限公司
IPC: G10L21/0208 , G10L25/30
Abstract: 本申请实施例公开了一种模型训练方法、音频处理方法、装置及电子设备,该模型训练方法包括:获取第一音频;第一音频具有第一噪声和第二噪声;第一噪声包括风噪噪声,第二噪声不同于第一噪声;基于第一音频对预设模型进行训练,得到具有目标模型,其中,目标模型用于去除第一噪声且保留第二噪声。通过本申请实施例的训练方法训练得到的目标模型,在去除风噪噪声时,可以保留非风噪噪声,降低了在去除风噪噪声过程对音频中的非风噪噪声的影响,提高了音频的处理效果。
-
公开(公告)号:CN119919535A
公开(公告)日:2025-05-02
申请号:CN202311433830.9
申请日:2023-10-31
Applicant: 北京小米移动软件有限公司
Abstract: 本公开是关于一种图像绘制方法、图像绘制装置及存储介质。图像绘制方法包括:获取待创作的第一图像;响应于检测到对待创作的第一图像进行绘制处理的操作,显示图像绘制选项,图像绘制选项包括图像绘制风格选项和图像绘制文本描述选项;基于用户选择的目标图像绘制风格选项,确定目标图像绘制风格,并获取用户基于图像绘制文本描述选项输入的目标图像绘制文本描述;基于目标图像绘制风格以及目标图像绘制文本描述,调用图像绘制模型;基于图像绘制模型,生成并显示目标图像,目标图像与待创作的第一图像符合相似度条件、并匹配目标图像绘制风格以及目标图像绘制文本描述。通过本公开,可实现自定义风格创作,并可满足用户需求进行二次创作。
-
公开(公告)号:CN119170037A
公开(公告)日:2024-12-20
申请号:CN202310739113.2
申请日:2023-06-20
Applicant: 北京小米移动软件有限公司
IPC: G10L21/0308 , G10L25/30
Abstract: 本公开是关于一种音源分离方法、装置及存储介质。其中,音源分离方法包括:获取混合音频的频域特征;将频域特征按照不同频带依次划分为多个子带频域特征;将多个子带频域特征中每一子带频域特征按照划分顺序与对应的全局子带频域特征融合,对融合有子带频域特征的全局子带频域特征进行全局子带频域特征识别,并将识别的结果作为与下一个子带频域特征融合的全局子带频域特征,重复执行上述融合以及全局子带频域特征识别的过程,直至完成识别次数的全局子带频域特征识别,得到混合音频的子带频域特征识别结果;基于混合音频的子带频域特征识别结果,对混合音频中包括的不同频带音源进行音源分离。通过本公开,能够实现多频带音源的分离。
-
-
-
-