语音检测方法和装置、电子设备及计算机可读存储介质

    公开(公告)号:CN115527555A

    公开(公告)日:2022-12-27

    申请号:CN202110707650.X

    申请日:2021-06-24

    发明人: 郑斯奇 索宏彬

    IPC分类号: G10L25/78

    摘要: 本申请公开了一种语音检测方法和装置、电子设备及计算机可读存储介质。该方法包括:获取由至少两个具有不同空间位置的麦克风组成的麦克风阵列采集的多个语音信号;对多个语音信号中的每一个在其接收方向上进行语音增强处理,以获得增强语音信号;将多个增强语音信号输入到预设模型,以生成语音特征序列;根据语音特征序列确定所述多个语音信号是否是来自多个声源。本申请实施例通过可以基于语音信号自身的语音特征和方位信息来生成语音特征序列,从而能够使得生成的语音特征序列更好地反映语音信号中的重叠语音特征,从而提高了重叠语音检测的准确率。

    一种触屏声音检测方法和装置

    公开(公告)号:CN112750458B

    公开(公告)日:2022-11-25

    申请号:CN201911043701.2

    申请日:2019-10-30

    IPC分类号: G10L25/06 G10L25/45 G10L25/78

    摘要: 本发明公开一种触屏声音检测方法和装置,该方法包括以下步骤:获取用户通过触屏设备录制的音频信号;对所述音频信号与模板信号进行相关度分析,得到所述音频信号与所述模板信号之间的相关系数;根据所述相关系数确定所述音频信号是否包含触屏声音。本发明对模板信号以及通过触屏设备录制的音频信号进行相关度分析,从而确定音频信号是否包含触屏信号,提升了触屏信号检测的准确率。

    连续唤醒识别功能的优化方法和装置

    公开(公告)号:CN111128166B

    公开(公告)日:2022-11-25

    申请号:CN201911379635.6

    申请日:2019-12-27

    发明人: 李路天 甘津瑞

    摘要: 本发明公开连续唤醒识别功能的优化方法和装置,其中,方法包括:持续接收音频直至检测到唤醒词;对包含唤醒词的音频进行语音识别以形成第一语音识别结果,并在预设时间内缓存第一音频之后接收的第二音频;判断第一语音识别结果中是否包含除唤醒词外的语音;若第一语音识别结果中不包含除唤醒词外的语音,判断对于所述第二音频的语音活性检测是否超时;若语音活性检测未超时,对第二音频进行语音识别以形成第二语音识别结果;若第二语音识别结果中包含除唤醒词外的语音,回调第二语音识别结果。本申请的方法和装置提供的方案可以对现有的连续唤醒识别功能进行优化,用户体验更好。

    用于运行听力系统的方法和听力系统

    公开(公告)号:CN112995873B

    公开(公告)日:2022-11-15

    申请号:CN202011456322.9

    申请日:2020-12-10

    发明人: T.亨普尔

    摘要: 本发明涉及一种用于运行包括助听器(2)和移动设备(4)的听力系统(1)的方法。根据该方法,在此借助助听器(2)的至少一个麦克风(6)来采集声音信号,并且将其转换为相关联的电麦克风信号,检查麦克风信号是否存在语音分量(32),借助嗓音识别来检查存在的语音分量(32)并且将在此识别出的声纹与特定讲话者(16)相关联。此外,借助移动设备(4)获得关于特定讲话者(16)的、除了个人信息之外的附加信息,并将其呈现给听力系统(1)的用户。

    一种歌曲人声检测方法及装置
    97.
    发明公开

    公开(公告)号:CN115331703A

    公开(公告)日:2022-11-11

    申请号:CN202210954394.9

    申请日:2022-08-10

    发明人: 何朋

    摘要: 本申请涉及音频处理技术领域,尤其涉及一种歌曲人声检测方法及装置,其方法包括获取待提取人声的音频数据,并对所述音频数据进行预处理;依据预设的特征提取策略提取预处理后的所述音频数据的音频特征;依据所述音频特征以及预设的人声识别模型,确定所述音频数据中每一音频帧为人声的概率值;当所述概率值达到预设的概率阈值时,则该概率值所对应的音频帧为人声帧;依据所述概率值和所述概率阈值确定所述音频数据中所有的所述人声帧,并确定所有的所述人声帧中时间序列为连续性关系的目标人声帧;依据所有的所述目标人声帧确定所述音频数据中的目标人声音频片段,用户可选择所需的人声音频片段用于后续编辑。

    一种基于图像识别和音频识别的游戏辅助系统

    公开(公告)号:CN110652726B

    公开(公告)日:2022-10-25

    申请号:CN201910926107.1

    申请日:2019-09-27

    发明人: 范科 邬鑫宇

    摘要: 本发明公开了一种基于图像识别和音频识别的游戏辅助系统,包括游戏图像采集预处理模块、游戏声音采集预处理模块、数字图像识别模块、数字音频识别模块以及识别结果提示模块,这五大模块是按照处理任务的逻辑功能进行划分,共同组成一个应用程序,各个模块间的数据传输和信号传递都是通过进程内通信技术完成,非常高效。因此,本发明系统能够准确识别出远处潜伏的敌人和交通工具以及发出枪声的方位,并实时在游戏屏幕上以醒目的颜色给出提示图标;此外,还能通过对电子罗盘和小地图的识别,给出玩家进入安全区的行进指示,通过这些辅助提示能增加普通初级玩家在游戏中的生存时间,提升游戏体验感。

    回声消除方法和装置
    99.
    发明授权

    公开(公告)号:CN111161752B

    公开(公告)日:2022-10-14

    申请号:CN201911420690.5

    申请日:2019-12-31

    发明人: 陈国明

    摘要: 本发明公开了回声消除方法、语音激活方法、回声消除装置、音频装置以及计算机可读存储介质。方法包括:获取第一音频信号和第二音频信号,第一音频信号为输入至扬声器的信号,第二音频信号为麦克风拾取的信号;通过线性自适应滤波算法对第一音频信号导致的回声信号进行估计,得到回声估计信号;提取回声估计信号的特征参数作为第一特征;提取误差信号的特征参数作为第二特征;将第一特征和第二特征输入至预先训练好的神经网络模型中,由神经网络输出用户语音信号的增益;计算误差信号和增益的乘积,以得到用户语音信号。

    使用低功率加速度计进行声音活动检测

    公开(公告)号:CN115171734A

    公开(公告)日:2022-10-11

    申请号:CN202210163081.1

    申请日:2022-02-22

    摘要: 本公开的各实施例总体上涉及使用低功率加速度计进行声音活动检测。本公开涉及用于检测人类语音的存在或不存在的设备和方法。设备和方法利用低功率加速度计。设备和方法使用加速度计生成加速度信号;利用带通滤波器或高通滤波器对加速度信号进行滤波;确定经滤波的加速度信号的至少一个计算;基于至少一个计算,检测声音的存在或不存在;以及输出指示声音存在或不存在的检测信号。设备和方法非常适用于具有有限电源的便携式音频设备,诸如真正的无线立体声耳机。