-
公开(公告)号:CN111639157B
公开(公告)日:2023-10-20
申请号:CN202010405181.1
申请日:2020-05-13
申请人: 广州国音智能科技有限公司
IPC分类号: G06F16/33 , G06F16/683 , G06F40/117 , G06F40/30 , G10L15/08 , G10L25/48
摘要: 本发明公开了一种音频标记方法、装置、设备及可读存储介质,所述音频标记方法根据目标信息对待标记音频中的重点片段进行自动标注,避免了人工剪切并标注的繁琐步骤,提高了确定并标注重点片段的效率;根据标记导出指令确定出当前所需的重点片段中的目标片段,使得用户可在重点片段中任意选择;通过生成目标片段对应的标记列表并导出当前所需的目标片段与标记列表,使得能够快速地按需批量导出音频片段以及对应的标识,提升了对于目标音频片段以及标注的获取效率。
-
公开(公告)号:CN111627421B
公开(公告)日:2023-08-11
申请号:CN202010405177.5
申请日:2020-05-13
申请人: 广州国音智能科技有限公司
摘要: 本发明公开了一种语音识别方法,该方法包括:当接收到语音识别指令时,获取所述语音识别指令对应的待对比语音;查找所述待对比语音中与预设语音样本相同的目标音节,并将所述预设语音样本的频谱中与所述目标音节对应的共振峰作为目标共振峰,将所述待对比语音的频谱中与所述目标音节对应的共振峰作为对象共振峰;获取所述目标共振峰的中心线和所述对象共振峰的中心线,并将所述目标共振峰的中心线与所述对象共振峰的中心线进行对比。本发明还公开了一种语音识别装置、设备及可读存储计算机可读存储介质。本发明通过自动且准确的确定共振峰中心线的方法,实现了简便且准确的基于共振峰中心线的语音识别方法。
-
公开(公告)号:CN110941737B
公开(公告)日:2023-01-20
申请号:CN201911247024.6
申请日:2019-12-06
申请人: 广州国音智能科技有限公司
IPC分类号: G06F16/61 , G06F16/68 , G06F16/683 , G06F16/687
摘要: 本申请公开了一种单机语音存储方法、装置、设备和可读存储介质,该方法包括采集语音信息,判断是否满足上传条件;若不满足上传条件,则获取语音信息的维度信息;将语音信息存储到维度信息在采集终端存储分区中所指向的目标存储分区,并为目标存储分区添加语音信息的索引标记;当检测到语音信息满足预设上传条件时,基于索引标记确定所述目标存储分区,将目标存储分区中语音信息和对应的维度信息上传。采集到语音信息后,判断是否满足上传条件,不满足上传条件,按照维度信息,找到采集终端中的目标存储分区,将语音信息存储并建立索引标记,若之后满足上传条件,根据索引标记,快速确定目标存储分区并上传语音信息和维度信息。
-
公开(公告)号:CN110970035B
公开(公告)日:2022-10-11
申请号:CN201911248623.X
申请日:2019-12-06
申请人: 广州国音智能科技有限公司
摘要: 本发明公开了一种单机语音识别方法,该单机语音识别方法包括:从声纹数据库中获取数据库声纹信息;根据预设规则对所述数据库声纹信息进行分区存储,得到分区存储声纹库;接收采集到的嫌疑人语音信息;解析所述嫌疑人语音信息,得到嫌疑人声纹信息;将所述嫌疑人声纹信息与所述分区存储声纹库进行比较,得到识别比较结果。本发明还公开了一种单机语音识别装置和一种计算机可读存储介质。本发明能够在无法连接网络的情况下,实现辨别嫌疑人的声纹信息的功能;能够在无法连接网络的情况下,实现快速辨别和查询嫌疑人的声纹信息的功能。
-
公开(公告)号:CN111627431B
公开(公告)日:2022-08-09
申请号:CN202010405131.3
申请日:2020-05-13
申请人: 广州国音智能科技有限公司
摘要: 本申请公开了一种语音识别方法、装置、终端和计算机可读存储介质,语音识别方法通过获取移动终端接收到的语音数据和所述移动终端的属性信息,其中,所述移动终端和网络服务器通信连接;将所述语音数据和所述属性信息发送至预设语音识别模型;基于所述语音数据、所述属性信息和所述预设语音识别模型,确定所述语音数据的识别时间,其中,所述识别时间为识别所述语音数据需要的时间;基于所述识别时间和预设时间阈值,判断是否将所述语音数据发送至所述网络服务器进行识别,实现了根据识别时间和预设时间阈值的关系确定是否由网络服务器进行语音识别,从而减少了网络服务器的工作压力和对网络资源的占据,并且节约了移动终端的流量。
-
公开(公告)号:CN110530494B
公开(公告)日:2022-08-09
申请号:CN201910818356.9
申请日:2019-08-30
申请人: 广州国音智能科技有限公司
摘要: 本申请实施例公开了一种声纹检测装置及方法,包括第一拾音传感器单元、第二拾音传感器及主控分析单元;第一拾音传感器单元通过接触测试者的方式采集测试者的第一声纹信号;第二拾音传感器单元采集通过空气传导的第二声纹信号;主控分析单元用于当测试者发声时,将第一声纹信号与第二声纹信号进行比对,判断是否为同一个人的声纹。本申请通过固体传导的方法避免了空旷室内环境以及噪声环境对声纹采集的影响。
-
公开(公告)号:CN110827834B
公开(公告)日:2022-07-12
申请号:CN201911098900.3
申请日:2019-11-11
申请人: 广州国音智能科技有限公司
摘要: 本发明公开了一种声纹注册方法,该方法包括:接收客户端发送的注册语音数据;将所述注册语音数据平均分割成整数份语音;分别计算所述整数份语音中每一份语音的特征语音向量;将每一份所述语音的特征语音向量进行两两对比打分,筛选出两两打分后比较的差值大于预设向量阈值的特征语音向量生成筛选特征语音向量;在注册语音数据中删除所述筛选特征语音向量对应的整数份语音,生成注册语音,并对注册语音进行语音注册。本发明还公开了一种系统和一种计算机可读存储介质。本发明能够降低声纹注册环境对声纹注册的影响,提高声纹识别的准确率。
-
公开(公告)号:CN110808061B
公开(公告)日:2022-03-15
申请号:CN201911098898.X
申请日:2019-11-11
申请人: 广州国音智能科技有限公司
IPC分类号: G10L21/0272 , G10L21/0232 , G10L21/0224 , G10L21/0208
摘要: 本发明公开了一种语音分离方法、装置、移动终端及计算机可读存储介质,所述语音分离方法包括:获取带噪语音信息,并提取所述带噪语音信息的特征向量,将所述特征向量输入至语音分离模型,并获取所述特征向量对应的目标振幅谱,对所述目标振幅谱进行后处理,以获取目标语音信息,可有效快速地将噪声从带噪语音中分离出来,以获取干净的语音信息。
-
公开(公告)号:CN109948718B
公开(公告)日:2022-03-15
申请号:CN201910233316.8
申请日:2019-03-26
申请人: 广州国音智能科技有限公司
IPC分类号: G06K9/62
摘要: 本申请提供一种基于多算法融合的系统及方法,其中系统包括:接入层和存储层;存储层包括源数据数据库、算法系统、生物特征数据库;算法系统包括至少一个生物特征识别算法系统和调度中心;接入层用于接收数据并对数据进行标准化操作;源数据数据库用于接收接入层的数据并存储;调度中心用于通过生物特征识别算法系统提取源数据数据库中的数据的生物特征信息,并生成存储生物特征信息的生物特征数据库;调度中心还用于将生物特征识别算法系统输出的识别结果进行整合,输出综合结果。本申请利用多算法融合有效解决市场上单个生物特征识别算法系统从无法达到实战要求到满足实战要求这一个过渡期的技术难题。
-
公开(公告)号:CN109979466B
公开(公告)日:2021-09-17
申请号:CN201910217724.4
申请日:2019-03-21
申请人: 广州国音智能科技有限公司
摘要: 本发明提供了一种声纹身份同一性鉴定方法、装置及计算机可读存储介质,该方法包括:获取用于同一性验证的各个待鉴定音频;对各个待鉴定音频进行共振峰提取,得到包含各个待鉴定音频的共振峰走向的宽带声纹图,其中,宽带声纹图的横坐标为带宽,纵坐标为频率;在宽带声纹图中,确定各个待鉴定音频的对应共振峰之间的特征参数;判断特征参数是否在预置范围内,若是,则通过同一性验证,若否,则不通过同一性验证。本发明通过将音频的声纹信息展示成横坐标为带宽、纵坐标为频率的宽带声纹图,可以更为直观的展示出音频的声纹特征,帮助快速验证声纹特征和验证身份同一性,提高声纹鉴定的效率。
-
-
-
-
-
-
-
-
-