-
公开(公告)号:CN118942435A
公开(公告)日:2024-11-12
申请号:CN202411008821.X
申请日:2024-07-25
申请人: 蔚来汽车科技(安徽)有限公司
摘要: 本申请适用于车辆领域,提供的一种歌曲的处理方法、电子设备、车辆及存储介质,通过在智能唱歌模式下,获取音频信号;确定所述音频信号的噪声信息和能量特征信息;根据所述噪声信息和所述能量特征信息确定是否存在用户的声音;在存在用户的声音的情况下,播放当前歌曲的伴奏音乐;在不存在用户的声音的情况下,播放所述当前歌曲的伴奏音乐和原唱的声音,能够实现在智能唱歌模式下,准确检测是否存在用户的声音,并且能够根据是否存在用户的声音,进行智能播放,提高用户的唱歌体验。
-
公开(公告)号:CN118609602B
公开(公告)日:2024-11-12
申请号:CN202410704261.5
申请日:2024-05-31
申请人: 江苏声望声学装备有限公司
摘要: 本发明涉及语音处理技术领域,且公开了一种基于语音信号的环境混响程度判断方法及系统,基于语音信号的环境混响程度判断方法通过判断系统进行判断,判断系统包括多维采集模块、混响分析模块和评估管控模块,判断方法包括以下步骤:步骤一、录制多段不同频率的语音信号,且每段语音信号时长相同;步骤二、在测试环境中输出语音信号,并进行采样,多维采集模块针对不同的数据源分类采集数据集;步骤三、综合分析语音信号在环境空间中能量衰减趋势和传播特性,混响分析模块对应计算生成波形特征Bxtz、频谱特征Putz和混响时间Hxsj;步骤四、评估管控模块判断测试环境混响程度,并对应生成管控报告。
-
公开(公告)号:CN117912487B
公开(公告)日:2024-11-12
申请号:CN202410074529.1
申请日:2024-01-18
申请人: 哈尔滨工业大学
摘要: 用于多余物检测的两级自适应多门限脉冲提取方法,属于密封电子设备多余物监测技术领域。为了解决现有的针对多余物检测的限脉冲提取方法因为门限缺少自适应性而导致提取到的脉冲信号准确性有待于进一步提高的问题。本发明首先计算声音信号包含的所有采样点的平均能量和平均过零率,根据3σ分布准则,设置峰值能量阈值、端点能量阈值和端点过零率阈值;通过峰值能量阈值先快速寻找有用脉冲的最高点,通过端点能量阈值先寻找一轮有用脉冲的起始点和结束点,然后再次根据3σ分布准则,重新设置端点能量阈值和端点过零率阈值两个新的门限,寻找第二轮有用脉冲的起始点和结束点,并最终根据两轮脉冲的持续时间确定最终的起始点和结束点。
-
公开(公告)号:CN118197344B
公开(公告)日:2024-11-08
申请号:CN202410327345.1
申请日:2024-03-21
申请人: 广东科技学院
发明人: 田野
IPC分类号: G10L21/0264 , G10L21/0208 , G10L25/21 , G10L25/18
摘要: 本发明涉及音频噪声过滤技术领域,具体涉及一种智慧物联网多媒体教学管理方法及系统,本发明根据多媒体教学音频数据的音频波动振幅的分布情况和音频波动相似情况进行分析,得到含有人声信息的待测教学音频区间;进一步对待测教学音频区间对应的语谱图的灰度分布情况进行分析,得到各个待测教学音频区间中极值点的噪声干扰程度;根据噪声干扰程度和极值点的分布得到的有效极值点对多媒体教学音频数据进行经验模态分解去噪处理,得到多媒体教学去噪音频数据,最后将多媒体教学去噪音频数据进行压缩存储,从而进行物联网多媒体教学管理。本发明通过获取有效极值点进行经验模态分解去噪处理的方法对物联网多媒体教学数据的管理效果更好。
-
公开(公告)号:CN118866011A
公开(公告)日:2024-10-29
申请号:CN202411333837.8
申请日:2024-09-24
摘要: 本发明属于环境噪声监测技术领域,本发明公开了一种基于自注意力机制的环境噪声监测方法,包括以下步骤:通过短时傅里叶变换将音频信号转换为频谱图;通过自注意力机制提取频谱图的声纹特征;通过神经网络声纹特征对应到具体的环境声源类别,本发明通过利用短时傅里叶变换将音频信号转换为频谱图,并结合自注意力机制提取频谱图中的声纹特征,实现了对环境声音的多维度监测与分析。这种方法能够捕捉到声音的频率、能量分布、时间变化等丰富信息,为环境声监测提供更加全面和准确的指标,并且自注意力机制能够自动学习频谱图中的关键信息,并赋予其更高的权重,从而有效提取出对分类任务至关重要的声纹特征。
-
公开(公告)号:CN118859098A
公开(公告)日:2024-10-29
申请号:CN202410900107.5
申请日:2024-07-05
申请人: 哈尔滨工程大学
摘要: 一种基于相参积累和脉冲串检测的水下信标信号检测方法,它属于水下探测技术领域。本发明解决了现有方法对水下信标信号检测概率低的问题。本发明对接收信号对应的短时傅里叶变换谱图能量进行分组,再对分组结果进行相参积累,可以有效地增大信噪比,有利于微弱水声信标信号的检测。利用水声信标信号的频率特性和周期特性进行脉冲串检测,可以有效对抗非平稳尖刺脉冲的干扰,降低检测的虚警概率,提高检测的准确率。本发明能够有效检测水声信标信号,具有很强的实际应用价值。本发明方法可以应用于水下微弱信标信号检测。
-
公开(公告)号:CN117711434B
公开(公告)日:2024-10-22
申请号:CN202311757605.0
申请日:2023-12-20
申请人: 书行科技(北京)有限公司
IPC分类号: G10L25/51 , G10L25/21 , G10L21/0208
摘要: 本申请公开了一种音频处理方法及装置、电子设备及计算机可读存储介质。该方法包括:获取原始音频、带噪音频和待测音频,原始音频包括语音,带噪音频通过向原始音频添加噪声得到,待测音频通过利用目标音频处理算法对带噪音频进行降噪得到;根据原始音频和待测音频,确定目标音频处理算法对带噪音频中的语音的第一降噪效果;根据带噪音频和待测音频,确定目标音频处理算法对带噪音频中的非语音的第二降噪效果;根据第一降噪效果和第二降噪效果,确定目标音频处理算法的第三降噪效果。通过该方法可实现从不同角度评价目标音频处理算法的降噪效果,以及评估音频处理算法的降噪效果。
-
公开(公告)号:CN114387953B
公开(公告)日:2024-10-22
申请号:CN202210088439.9
申请日:2022-01-25
申请人: 重庆卡佐科技有限公司
IPC分类号: G10L15/02 , G10L15/06 , G10L15/16 , G10L21/0224 , G10L21/0264 , G10L25/21 , G10L25/45
摘要: 本申请公开了一种车载环境下的语音增强方法和语音识别方法,将改进的谱减法结合模糊理论,使得谱减法系数能够自适应不同的语音信号,能够有效的消除噪音,避免“音乐噪音”问题,同时提高信噪比,保留了语音信号的有效信号。通过实际仿真运算和车内实验,采用本文算法后,能够有效提高行驶车内的语音识别准确率。
-
公开(公告)号:CN112970062B
公开(公告)日:2024-10-18
申请号:CN201980070712.1
申请日:2019-08-08
申请人: 诺基亚技术有限公司
IPC分类号: G10L19/008 , G10L19/02 , G10L25/18 , G10L25/21 , H04S7/00
摘要: 一种装置,包括用于执行以下操作的部件:获得至少一个音频信号;针对与至少一个音频信号相关联的至少两个频带中的每个频带,分别获得至少一个参数;基于比较针对至少两个频带中的每个频带的至少一个其他相应的参数,选择至少两个频带中的频带,其中,至少一个其他相应的参数是根据至少两个频带中的每个频带来确定的;以及生成输出,包括与至少两个频带中的被选择频带相关联的至少一个参数的选择,以使得与被选择频带相关联的至少一个参数的选择被配置为减小该输出的比特率或大小,其中,被选择频带的至少一个参数被配置为表示至少两个频带的相应的参数。
-
公开(公告)号:CN118782090A
公开(公告)日:2024-10-15
申请号:CN202310429931.2
申请日:2023-04-10
申请人: 腾讯科技(深圳)有限公司
发明人: 梁俊斌
IPC分类号: G10L25/21 , G10L25/87 , G10L25/51 , G10L21/10 , G10L21/0232 , G10K11/175
摘要: 本申请实施例提供了一种音频处理方法及相关设备,其中方法包括:可先获取多声源混音场景中的每个声源的音频信号;并确定每个声源所处的音频感知能量图层,任一声源所处的音频感知能量图层用于指示相应声源的音频信号需具有的响度级别,且响度级别与相应音频感知能量图层的层级成正相关,响度级别低的音频信号被响度级别高的音频信号掩蔽;再分别根据各个声源所处的音频感知能量图层,调整相应声源的音频信号的响度,以使任一声源的调整后的音频信号具有相应声源所处的音频感知能量图层所指示的响度级别;最终对各个声源的调整后的音频信号进行混音处理,得到混音信号。通过本申请实施例,有利于提升音频信号中信息传递的有效性。
-
-
-
-
-
-
-
-
-