一种视频编码方法、装置及计算机可读存储介质

    公开(公告)号:CN111669594A

    公开(公告)日:2020-09-15

    申请号:CN202010585488.4

    申请日:2020-06-23

    摘要: 本申请公开了一种视频编码方法、装置及计算机可读存储介质。该方法包括:获取待编码视频数据,待编码视频数据包括多个原始帧;按照预设编码方式,对所述多个原始帧中的前N个第一类原始帧依次进行编码,以得到与所述N个第一类原始帧分别对应的N个编码帧;根据N个所述第一类原始帧和对应的N个所述编码帧确定质量参数;将所述质量参数作为码率控制模型的固定参数,以根据所述码率控制模型对除所述N个第一类原始帧之后的多个第二类原始帧进行依次编码;在每一个第二类原始帧编码完成后,根据对应的单位像素比特和所述质量参数,对所述码率控制模型的可变参数进行修正;其中,N为正整数。通过上述方式,本申请能够实现质量稳定的视频编码。

    一种基于金字塔的图像滤波方法、装置及存储介质

    公开(公告)号:CN111652818A

    公开(公告)日:2020-09-11

    申请号:CN202010475358.5

    申请日:2020-05-29

    IPC分类号: G06T5/00

    摘要: 本申请公开了一种基于金字塔的图像滤波方法、装置及存储介质,该方法包括:构建待处理图像的图像金字塔;按照分辨率的顺序依次从图像金字塔中取出下采样图像作为当前层图像;对当前层图像进行滤波,得到中间滤波图像;对中间滤波图像进行上采样,得到上采样图像;将上采样图像与当前层图像的下一层图像进行融合,得到融合图像;将融合图像作为当前层图像,并判断当前层是否为最后一层;若当前层不为最后一层,则返回对当前层图像进行滤波,得到中间滤波图像的步骤;若当前层为最后一层,则得到中间处理图像,将中间处理图像与待处理图像融合,对融合后的图像进行滤波,得到滤波图像,并输出。通过上述方式,本申请能够抑制误差,提升滤波效果。

    一种图像去噪方法、装置以及存储介质

    公开(公告)号:CN110796615A

    公开(公告)日:2020-02-14

    申请号:CN201910994941.4

    申请日:2019-10-18

    IPC分类号: G06T5/00 G06T7/13

    摘要: 本申请公开了一种图像去噪方法、装置以及存储介质,包括以下步骤:获取原始图像;对原始图像进行边缘点检测,以确定原始图像的原始像素中的边缘点像素;对去除边缘点像素的原始图像进行噪声估计,以获取原始图像的噪声等级;基于噪声等级对原始图像进行相似度滤波,其中不同的所述噪声等级对应于不同的滤波参数。通过上述方式,本申请能够有效提升图像的去噪效果。

    图像编码方法及图像处理装置、计算机可读存储介质

    公开(公告)号:CN112055209B

    公开(公告)日:2024-08-02

    申请号:CN202010782344.8

    申请日:2020-08-06

    摘要: 本申请公开了一种图像编码方法及图像处理装置、计算机可读存储介质。其中,所述图像编码方法包括:根据待编码块所适用的预设预测编码技术构建所述预设预测编码技术对应的列表;其中,所述预设预测编码技术包括至少一种预测编码技术,所述列表列出有所述预设预测编码技术对应的可选项中的至少部分可选项;基于所述列表从所述预设预测编码技术对应的可选项中选出所述待编码块的预测信息,以对所述待编码块进行编码。上述方案,能够提升编码压缩率。

    噪声抑制方法、装置、设备及存储介质

    公开(公告)号:CN118280381A

    公开(公告)日:2024-07-02

    申请号:CN202410233018.X

    申请日:2024-02-29

    IPC分类号: G10L21/0208 H04M9/08

    摘要: 本申请公开了一种噪声抑制方法、装置、设备及存储介质,该噪声抑制方法包括:确定带噪语音中各个位置存在语音的概率,得到语音存在概率;利用语音存在概率计算带噪语音对应的噪声信号谱,基于噪声信号谱计算得到带噪语音对应的先验信噪比;基于先验信噪比计算带噪语音对应的初始增益,以及,基于先验信噪比设定带噪语音对应的增益阈值;采用增益阈值对初始增益进行修正,得到目标增益;按照目标增益对带噪语音进行噪声抑制,得到语音保留结果。可以结合先验信噪比计算结果,给初始增益增加阈值控制,能够更好地适应不同的信噪比场景,提高增益计算的准确性,从而达到在噪声抑制中加强语音保留的目的。

    声音检测方法、设备和存储介质
    47.
    发明公开

    公开(公告)号:CN117809689A

    公开(公告)日:2024-04-02

    申请号:CN202311544715.9

    申请日:2023-11-17

    摘要: 本发明公开了一种声音检测方法、设备和存储介质,声音检测方法包括:利用第一分类模型对待检测声音数据中的若干目标声音片段分别进行分类检测,得到各目标声音片段的检测结果,其中,目标声音片段的检测结果用于表征目标声音片段所属的第一片段声音事件类型,以及各且包括目标声音片段属于第一片段声音事件类型的第一片段概率;分别利用各目标声音片段的概率可信度调整各目标声音片段对应的第一片段概率;利用各目标声音片段经调整的第一片段概率,筛选得到第一类型集合,第一类型集合包括至少一个目标声音片段的第一片段声音事件类型;利用第一类型集合,确定若干目标声音片段的目标声音事件类型。通过上述方式,能够提高声音检测的准确性。

    一种音频事件检测模型生成方法、装置、设备及存储介质

    公开(公告)号:CN117789754A

    公开(公告)日:2024-03-29

    申请号:CN202311766464.9

    申请日:2023-12-21

    摘要: 本申请公开了一种音频事件检测模型生成方法、装置、设备及存储介质,涉及音频事件检测技术领域。该方法包括:对获取到的N个原始音频数据进行标注,得到标注后的N个目标音频数据,以及N个目标音频数据各自的标签信息,N为大于1的整数;对N个目标音频数据进行特征提取,得到N个目标音频数据的第一特征向量数据;基于扩散模型以及设定的增强模式,对第一特征向量数据进行特征增强,得到增强后的特征向量数据;对该增强后的特征向量数据进行筛选,得到符合筛选要求的目标特征向量数据;根据N个目标音频数据各自的标签信息、第一特征向量数据,以及目标特征向量数据,生成音频事件检测模型,用以提高音频事件检测模型的泛化性和检测性能。

    语音信号的处理方法、装置、存储介质及电子装置

    公开(公告)号:CN116052708A

    公开(公告)日:2023-05-02

    申请号:CN202211698996.9

    申请日:2022-12-28

    IPC分类号: G10L21/034

    摘要: 本发明实施例提供了一种语音信号的处理方法、装置、存储介质及电子装置,其中,该方法包括:获取当前帧语音信号;根据第一增益值对当前帧语音信号进行第一放大操作,得到第一放大信号,其中,第一增益值是根据当前帧语音信号的上一帧语音信号及第二语音信号确定的,第二语音信号是对上一帧语音信号进行第一放大操作和第二放大操作后得到的语音信号;根据第一放大信号的第一特征值确定第二增益值,并根据第二增益值对第一放大信号进行第二放大操作,得到目标语音信号。通过本发明实施例,解决了相关技术中存在的语音自动增益控制方法的稳定性较差的问题。

    一种音量调节方法、装置、电子设备及存储介质

    公开(公告)号:CN115988385A

    公开(公告)日:2023-04-18

    申请号:CN202211730511.X

    申请日:2022-12-30

    IPC分类号: H04R3/00

    摘要: 本申请公开了一种音量调节方法、装置、电子设备及存储介质,确定待音量调节设备与正前方障碍物的距离、所述待音量调节设备所处环境的空间尺寸;根据所述待音量调节设备所处环境的空间尺寸,确定混响时间;根据所述混响时间,确定声压级差异值;获取录制的环境噪声的声音能量,根据所述声音能量和预先标定的声音能量,确定最小音量值;获取待播放音源的声音能量,根据预先标定的声压级、所述待播放音源的声音能量、所述待音量调节设备与正前方障碍物的距离和所述声压级差异值,确定所述障碍物处的音量值;根据所述音量值与所述最小音量值的差值,对所述待音量调节设备进行音量调节。实现了一种自适应音量调节的方案。