-
公开(公告)号:CN115547312A
公开(公告)日:2022-12-30
申请号:CN202211513025.2
申请日:2022-11-30
申请人: 深圳时识科技有限公司 , 成都时识科技有限公司
发明人: 苏尼尔·希拉万特 , 赛义德·哈格哈特舒尔 , 乔宁 , 张华秋 , 白鑫
摘要: 本发明公开了一种带活动检测的预处理器、芯片和电子设备。为了最大限度的降低永远在线的语音识别功耗,本发明涉及带活动检测的预处理器,活动检测模块耦接于低功耗放大器与多个并行通道之间,基于所述活动检测模块在最佳窗口上累积的输入信号能量,以激活或关闭后续多个并行通道的运行。本发明在预处理器的并行通道之前检测是否有需要的输入信号,最大限度地降低了功耗,且实现简单、鲁棒性好、虚警率低。本发明适于基于神经形态的感知与计算领域。
-
公开(公告)号:CN115527555A
公开(公告)日:2022-12-27
申请号:CN202110707650.X
申请日:2021-06-24
申请人: 阿里巴巴新加坡控股有限公司
IPC分类号: G10L25/78
摘要: 本申请公开了一种语音检测方法和装置、电子设备及计算机可读存储介质。该方法包括:获取由至少两个具有不同空间位置的麦克风组成的麦克风阵列采集的多个语音信号;对多个语音信号中的每一个在其接收方向上进行语音增强处理,以获得增强语音信号;将多个增强语音信号输入到预设模型,以生成语音特征序列;根据语音特征序列确定所述多个语音信号是否是来自多个声源。本申请实施例通过可以基于语音信号自身的语音特征和方位信息来生成语音特征序列,从而能够使得生成的语音特征序列更好地反映语音信号中的重叠语音特征,从而提高了重叠语音检测的准确率。
-
公开(公告)号:CN115410569A
公开(公告)日:2022-11-29
申请号:CN202210958490.0
申请日:2022-08-09
申请人: 山东新一代信息产业技术研究院有限公司
摘要: 本申请公开了一种用于迎宾讲解机器人的语音命令识别方法、设备及介质,用以解决现有的迎宾讲解机器人在离线时,无法进行语音命令识别的技术问题。方法包括:采集语音数据,并基于语音数据对预设模型进行训练,得到语音命令识别模型;将所述语音命令识别模型部署到迎宾讲解机器人上;对输入所述迎宾讲解机器人的音频数据进行VAD检测,得到语音命令;将所述语音命令输入至所述语音命令识别模型中,得到所述音频数据对应的识别结果。
-
公开(公告)号:CN112750458B
公开(公告)日:2022-11-25
申请号:CN201911043701.2
申请日:2019-10-30
申请人: 北京爱数智慧科技有限公司
摘要: 本发明公开一种触屏声音检测方法和装置,该方法包括以下步骤:获取用户通过触屏设备录制的音频信号;对所述音频信号与模板信号进行相关度分析,得到所述音频信号与所述模板信号之间的相关系数;根据所述相关系数确定所述音频信号是否包含触屏声音。本发明对模板信号以及通过触屏设备录制的音频信号进行相关度分析,从而确定音频信号是否包含触屏信号,提升了触屏信号检测的准确率。
-
公开(公告)号:CN111128166B
公开(公告)日:2022-11-25
申请号:CN201911379635.6
申请日:2019-12-27
申请人: 思必驰科技股份有限公司
IPC分类号: G10L15/22 , G10L15/26 , G10L15/30 , G10L25/78 , H04L67/5683
摘要: 本发明公开连续唤醒识别功能的优化方法和装置,其中,方法包括:持续接收音频直至检测到唤醒词;对包含唤醒词的音频进行语音识别以形成第一语音识别结果,并在预设时间内缓存第一音频之后接收的第二音频;判断第一语音识别结果中是否包含除唤醒词外的语音;若第一语音识别结果中不包含除唤醒词外的语音,判断对于所述第二音频的语音活性检测是否超时;若语音活性检测未超时,对第二音频进行语音识别以形成第二语音识别结果;若第二语音识别结果中包含除唤醒词外的语音,回调第二语音识别结果。本申请的方法和装置提供的方案可以对现有的连续唤醒识别功能进行优化,用户体验更好。
-
公开(公告)号:CN112995873B
公开(公告)日:2022-11-15
申请号:CN202011456322.9
申请日:2020-12-10
申请人: 西万拓私人有限公司
发明人: T.亨普尔
摘要: 本发明涉及一种用于运行包括助听器(2)和移动设备(4)的听力系统(1)的方法。根据该方法,在此借助助听器(2)的至少一个麦克风(6)来采集声音信号,并且将其转换为相关联的电麦克风信号,检查麦克风信号是否存在语音分量(32),借助嗓音识别来检查存在的语音分量(32)并且将在此识别出的声纹与特定讲话者(16)相关联。此外,借助移动设备(4)获得关于特定讲话者(16)的、除了个人信息之外的附加信息,并将其呈现给听力系统(1)的用户。
-
公开(公告)号:CN115331703A
公开(公告)日:2022-11-11
申请号:CN202210954394.9
申请日:2022-08-10
申请人: 成都开心音符科技有限公司
发明人: 何朋
摘要: 本申请涉及音频处理技术领域,尤其涉及一种歌曲人声检测方法及装置,其方法包括获取待提取人声的音频数据,并对所述音频数据进行预处理;依据预设的特征提取策略提取预处理后的所述音频数据的音频特征;依据所述音频特征以及预设的人声识别模型,确定所述音频数据中每一音频帧为人声的概率值;当所述概率值达到预设的概率阈值时,则该概率值所对应的音频帧为人声帧;依据所述概率值和所述概率阈值确定所述音频数据中所有的所述人声帧,并确定所有的所述人声帧中时间序列为连续性关系的目标人声帧;依据所有的所述目标人声帧确定所述音频数据中的目标人声音频片段,用户可选择所需的人声音频片段用于后续编辑。
-
公开(公告)号:CN110652726B
公开(公告)日:2022-10-25
申请号:CN201910926107.1
申请日:2019-09-27
申请人: 杭州顺网科技股份有限公司
IPC分类号: A63F13/5375 , A63F13/5378 , A63F13/533 , G10L19/02 , G10L25/51 , G10L25/78
摘要: 本发明公开了一种基于图像识别和音频识别的游戏辅助系统,包括游戏图像采集预处理模块、游戏声音采集预处理模块、数字图像识别模块、数字音频识别模块以及识别结果提示模块,这五大模块是按照处理任务的逻辑功能进行划分,共同组成一个应用程序,各个模块间的数据传输和信号传递都是通过进程内通信技术完成,非常高效。因此,本发明系统能够准确识别出远处潜伏的敌人和交通工具以及发出枪声的方位,并实时在游戏屏幕上以醒目的颜色给出提示图标;此外,还能通过对电子罗盘和小地图的识别,给出玩家进入安全区的行进指示,通过这些辅助提示能增加普通初级玩家在游戏中的生存时间,提升游戏体验感。
-
公开(公告)号:CN111161752B
公开(公告)日:2022-10-14
申请号:CN201911420690.5
申请日:2019-12-31
申请人: 歌尔股份有限公司
发明人: 陈国明
IPC分类号: G10L21/0208 , G10L21/0232 , G10L25/78
摘要: 本发明公开了回声消除方法、语音激活方法、回声消除装置、音频装置以及计算机可读存储介质。方法包括:获取第一音频信号和第二音频信号,第一音频信号为输入至扬声器的信号,第二音频信号为麦克风拾取的信号;通过线性自适应滤波算法对第一音频信号导致的回声信号进行估计,得到回声估计信号;提取回声估计信号的特征参数作为第一特征;提取误差信号的特征参数作为第二特征;将第一特征和第二特征输入至预先训练好的神经网络模型中,由神经网络输出用户语音信号的增益;计算误差信号和增益的乘积,以得到用户语音信号。
-
公开(公告)号:CN115171734A
公开(公告)日:2022-10-11
申请号:CN202210163081.1
申请日:2022-02-22
申请人: 意法半导体股份有限公司
IPC分类号: G10L25/78 , G10L25/87 , G10K11/178 , G06K9/62 , G06K9/00
摘要: 本公开的各实施例总体上涉及使用低功率加速度计进行声音活动检测。本公开涉及用于检测人类语音的存在或不存在的设备和方法。设备和方法利用低功率加速度计。设备和方法使用加速度计生成加速度信号;利用带通滤波器或高通滤波器对加速度信号进行滤波;确定经滤波的加速度信号的至少一个计算;基于至少一个计算,检测声音的存在或不存在;以及输出指示声音存在或不存在的检测信号。设备和方法非常适用于具有有限电源的便携式音频设备,诸如真正的无线立体声耳机。
-
-
-
-
-
-
-
-
-