一种音频分类方法、系统、装置及存储介质

    公开(公告)号:CN114283841B

    公开(公告)日:2023-06-06

    申请号:CN202111560886.1

    申请日:2021-12-20

    发明人: 王伟

    摘要: 本发明公开了一种音频分类方法、系统、装置及存储介质,方法包括:获取待分类的第一音频信号,对第一音频信号进行分帧处理得到第二音频信号;对第二音频信号进行端点检测,去除位于第二音频信号的首部和尾部的低能量音频段得到第三音频信号;确定第三音频信号中每一音频帧的短时平均过零率,确定短时平均过零率大于等于预设的第一阈值的第一音频帧数量以及短时平均过零率的波动情况;根据第一音频帧数量和波动情况对第一音频信号进行分类。本发明通过对音频信号进行分帧处理、端点检测并确定音频帧的短时平均过零率,可以对音频信号进行分类,识别出纯音乐音频、纯语音音频以及混合音频,提高了音频分类的准确性,可广泛应用于音频分类技术领域。

    一种指令音频生成方法、系统、装置与存储介质

    公开(公告)号:CN114283840B

    公开(公告)日:2023-04-18

    申请号:CN202111582203.2

    申请日:2021-12-22

    发明人: 王伟

    IPC分类号: G10L25/03 G10L25/21 G10L25/69

    摘要: 本申请公开了一种指令音频生成方法、系统、装置和存储介质,其中方法包括以下步骤:获取第一音频并计算所述第一音频中每一帧的帧音频能量和帧信噪比;其中,所述第一音频至少包括指令音频,空白音频和噪声音频;根据所述帧音频能量,确定所述空白音频的第一起点帧和第一终点帧;对所述第一起点帧和所述第一终点帧之间的音频进行剪切,得到第二音频;根据所述帧信噪比,在所述第二音频中确定所述噪声音频的第二起点帧和第二终点帧;对所述第二起点帧和所述第二终点帧之间的音频进行剪切,得到指令音频。本方法可以减少需要识别处理的信息量,降低系统识别处理的计算量和时耗,有效提高系统的识别性能。本申请可广泛应用于音频剪切技术领域内。

    一种实时视频特效的渲染方法、系统、装置及存储介质

    公开(公告)号:CN113613066A

    公开(公告)日:2021-11-05

    申请号:CN202110884172.X

    申请日:2021-08-03

    发明人: 陆赞信 王伟 曾荣

    摘要: 本发明提供的一种实时视频特效的渲染方法、系统、装置及介质,方法包括以下步骤:获取第一视频素材,根据第一视频素材的渲染工序划分得到第一素材内容和第二素材内容;通过渲染预测得到第一素材内容的第一优先级以及第二素材内容的第二优先级,根据第一优先级和第二优先级确定渲染队列;根据渲染队列进行图形处理资源的线程分配,根据线程分配的结果对第一素材内容进行切片特效渲染得到第一渲染内容,和对第二部分素材内容进行特效渲染得到第二渲染内容;将第一渲染内容与第二渲染内容进行融合渲染,得到特效视频;方法不仅通过渲染预测和切片渲染的方式提高了视频渲染效率,还降低了创作门槛,提升了用户体验,可广泛应用于图像处理技术领域。

    片段音频歌词生成方法、装置、计算机设备和存储介质

    公开(公告)号:CN110209872B

    公开(公告)日:2021-06-22

    申请号:CN201910456523.X

    申请日:2019-05-29

    摘要: 本申请涉及一种片段音频歌词生成方法、装置、计算机设备和存储介质。所述方法包括:获取片段音频数据;提取片段音频数据的音频指纹;根据音频指纹,检索对应的全曲音频数据,并确定片段音频数据在全曲音频数据中的起始时刻和终止时刻;获取全曲音频数据对应的全曲歌词数据;根据起始时刻和终止时刻,从全曲歌词数据中得到目标歌词数据;根据目标歌词数据,生成片段音频数据的歌词数据。采用本方法无需利用歌曲名称或歌手姓名等标识信息进行检索,检索效率和准确率高;且可自动生成片段音频数据的歌词数据,耗时短,无需人工裁剪音频,且歌词与音频高度匹配,同步性佳。

    歌声生成方法、装置、计算机设备和存储介质

    公开(公告)号:CN109817197A

    公开(公告)日:2019-05-28

    申请号:CN201910158956.7

    申请日:2019-03-04

    摘要: 本申请涉及一种歌声生成方法、装置、计算机设备和存储介质。所述方法包括:获取第一歌声数据;提取出所述第一歌声数据的MFCC特征、基频、非周期性值及清浊音判决结果;将所述MFCC特征输入至语音识别模型,获得第一概率矩阵;将所述第一概率矩阵输入至音色转换模型,获得所述MFCC特征对应的幅度谱;根据所述幅度谱、基频、非周期性值及清浊音判决结果生成第二歌声数据。采用本方法能够快速高效地合成明星唱歌的声音,极大地降低了歌曲录制的难度。

    一种视频内容检测方法、装置、电子设备和存储介质

    公开(公告)号:CN116935272A

    公开(公告)日:2023-10-24

    申请号:CN202310857526.0

    申请日:2023-07-12

    摘要: 本发明公开了一种视频内容检测方法、装置、电子设备和存储介质,其中,方法包括:获取待检测视频,所述待检测视频包括第一视频和第二视频;对所述待检测视频进行视频关键帧提取处理,得到视频关键帧;对所述视频关键帧进行运动特征提取处理,得到运动特征曲线;根据所述运动特征曲线对所述待检测视频进行相似度计算处理,得到视频相似度计算结果;当所述视频相似度计算结果满足预设条件时,确定所述第一视频和所述第二视频为重复内容视频。本发明实施例通过对运动特征曲线进行相似度计算处理,能够提高视频内容检测的效率,可广泛应用于视频检测技术领域。

    一种复杂环境下的音频处理方法、装置及存储介质

    公开(公告)号:CN114360517B

    公开(公告)日:2023-04-18

    申请号:CN202111551933.6

    申请日:2021-12-17

    发明人: 王伟

    摘要: 本发明公开了一种复杂环境下的音频处理方法、装置及存储介质,本发明通过获取音频训练数据,通过所述音频训练数据以及词库语句库对神经网络模型进行训练,所述神经网络模型为时滞递归神经网络结合隐马尔可夫模型的深层神经网络声学模型,结合包含对话场景下的常用的词汇或者语句的所述词库语句库进行训练,能够提高噪声环境下语音识别的性能以及提升抗鲁棒性;将待接收者的音频数据输入至训练后的神经网络模型,得到输出内容并将所述输出内容通过语音向待接收者播放,使得输出内容更加准确地向待接收者播放,改善和提高了与待接收者交流的准确性,减少错误,本发明可广泛应用于音频处理技术领域。

    一种复杂环境下的音频处理方法、装置及存储介质

    公开(公告)号:CN114360517A

    公开(公告)日:2022-04-15

    申请号:CN202111551933.6

    申请日:2021-12-17

    发明人: 王伟

    摘要: 本发明公开了一种复杂环境下的音频处理方法、装置及存储介质,本发明通过获取音频训练数据,通过所述音频训练数据以及词库语句库对神经网络模型进行训练,所述神经网络模型为时滞递归神经网络结合隐马尔可夫模型的深层神经网络声学模型,结合包含对话场景下的常用的词汇或者语句的所述词库语句库进行训练,能够提高噪声环境下语音识别的性能以及提升抗鲁棒性;将待接收者的音频数据输入至训练后的神经网络模型,得到输出内容并将所述输出内容通过语音向待接收者播放,使得输出内容更加准确地向待接收者播放,改善和提高了与待接收者交流的准确性,减少错误,本发明可广泛应用于音频处理技术领域。

    一种视频模板合成和推荐系统、方法、装置及存储介质

    公开(公告)号:CN112667910B

    公开(公告)日:2022-03-04

    申请号:CN202110021298.4

    申请日:2021-01-08

    摘要: 本发明公开了一种视频模板合成和推荐系统、方法、装置及存储介质,所述系统包括AE插件模块、管理平台模块、管理平台、特征提取分析模块、构建模块和推荐模块,本发明通过AE插件模块,可以方便快捷地设计视频模板,大大降低视频模板制作周期,提高视频模板更新速度;同时,可快速导出视频模板的配置和素材,方便快捷地生成准确配置参数,省去人工配置时间,避免人工配置失误;通过特征提取分析模块和构建模块,可构建视频模板画像和用户画像,可以更好地掌握视频模板效果走向,以及更有针对性地设计视频模板;通过推荐模块,可向用户推荐更适合更感兴趣的视频模板,减少用户的筛选时间,提高视频模板的有效使用率。

    图像处理方法、装置、计算机设备和存储介质

    公开(公告)号:CN109934783A

    公开(公告)日:2019-06-25

    申请号:CN201910158997.6

    申请日:2019-03-04

    IPC分类号: G06T5/00 G06T5/50

    摘要: 本申请涉及一种图像处理方法、装置、计算机设备和存储介质。所述方法包括:获取YUV图像数据;将所述YUV图像数据从中央处理器内存复制至图形处理器内存;在所述图形处理器内存中将所述YUV图像数据并行转换为RGB图像数据;对所述RGB图像数据进行图像美化操作,获得经过美化的RGB图像数据;将所述经过美化的RGB图像数据并行转换为最终YUV图像数据;输出所述最终YUV图像数据。采用本方法能够输出最终YUV图像数据,降低设备的图像处理的时间,提高图像处理的效率。