-
公开(公告)号:CN110992961A
公开(公告)日:2020-04-10
申请号:CN201911248128.9
申请日:2019-12-06
申请人: 广州国音智能科技有限公司
摘要: 本发明公开了一种音频数据同步方法,所述音频数据同步方法应用于音频数据同步装置,所述音频数据同步装置包括同步终端,该方法包括:同步终端接收音频同步指令;根据音频同步指令从省级声纹库读取省级音频信息,并根据音频同步指令从国家声纹库读取国家音频信息;将每条省级音频信息依次与每条国家音频信息进行比对;若省级音频信息与国家音频信息进行比对的相似度小于预设同步阈值,则将省级音频信息保存至国家声纹库。本发明还公开了一种装置和一种计算机可读存储介质。本发明能够实现将国家声纹库和省级声纹库进行同步,减少国家声纹库和省级声纹库数据的冗余,提高国家声纹库和省级声纹库的识别效率。
-
公开(公告)号:CN110970051A
公开(公告)日:2020-04-07
申请号:CN201911248621.0
申请日:2019-12-06
申请人: 广州国音智能科技有限公司
IPC分类号: G10L21/0216 , G10L21/0232 , G10L21/0264 , G10L25/21 , G10L25/27 , G10L25/45
摘要: 本发明公开了一种语音数据采集方法,通过获取带噪语音信号,估计所述带噪语音信号中语音信号的语音占比估计值,判断所述语音占比估计值是否小于预设语音占比值,若所述语音占比估计值小于预设语音占比值,则对所述带噪语音信号进行降噪处理,得到降噪语音信号。本发明还公开了一种终端、可读存储介质。实现了在提高语音数据采集质量的同时保证了语音信号真实性的目的。
-
公开(公告)号:CN110941737A
公开(公告)日:2020-03-31
申请号:CN201911247024.6
申请日:2019-12-06
申请人: 广州国音智能科技有限公司
IPC分类号: G06F16/61 , G06F16/68 , G06F16/683 , G06F16/687
摘要: 本申请公开了一种单机语音存储方法、装置、设备和可读存储介质,该方法包括采集语音信息,判断是否满足上传条件;若不满足上传条件,则获取语音信息的维度信息;将语音信息存储到维度信息在采集终端存储分区中所指向的目标存储分区,并为目标存储分区添加语音信息的索引标记;当检测到语音信息满足预设上传条件时,基于索引标记确定所述目标存储分区,将目标存储分区中语音信息和对应的维度信息上传。采集到语音信息后,判断是否满足上传条件,不满足上传条件,按照维度信息,找到采集终端中的目标存储分区,将语音信息存储并建立索引标记,若之后满足上传条件,根据索引标记,快速确定目标存储分区并上传语音信息和维度信息。
-
公开(公告)号:CN110866555A
公开(公告)日:2020-03-06
申请号:CN201911099334.8
申请日:2019-11-11
申请人: 广州国音智能科技有限公司
IPC分类号: G06K9/62
摘要: 本申请公开了一种增量数据的聚类方法、装置、设备和可读存储介质,该增量数据的聚类方法包括对初始数据聚类,获取初始聚类结果,初始聚类结果包括初始数据的簇和各初始数据的簇的初始聚类中心;计算相对初始数据之后获取的增量数据到各初始聚类中心的初始距离组;若初始距离组中的最小距离不大于第一预设距离,则将增量数据添加到最小距离对应的初始聚类中心的簇中;若所述第一距离组中的最小距离大于第一预设距离,则将所述增量数据保存到缓冲区;对缓冲区中的增量数据聚类。对于获取的增量数据,不需要与初始数据一起全部重新迭代聚类,通过与初始聚类中心的距离对于增量数据进行聚类方式的区分,减少聚类方法需要的存储空间同时效率更高。
-
公开(公告)号:CN110827853A
公开(公告)日:2020-02-21
申请号:CN201911099179.X
申请日:2019-11-11
申请人: 广州国音智能科技有限公司
摘要: 本申请公开了一种语音特征信息提取方法、终端和计算机可读存储介质,通过获取发言人目标语音数据,得到目标语音片段;获取发言人基准语音数据;比对各所述目标语音片段和所述基准语音数据,获得比对结果;基于所述比对结果,生成并提取各所述目标语音片段中的发言人语音特征信息,实现语音特征信息的提取,由此可以在多个发言人情境下,将所有发言人的语音特征信息区分并提取出来。
-
公开(公告)号:CN110808061A
公开(公告)日:2020-02-18
申请号:CN201911098898.X
申请日:2019-11-11
申请人: 广州国音智能科技有限公司
IPC分类号: G10L21/0272 , G10L21/0232 , G10L21/0224 , G10L21/0208
摘要: 本发明公开了一种语音分离方法、装置、移动终端及计算机可读存储介质,所述语音分离方法包括:获取带噪语音信息,并提取所述带噪语音信息的特征向量,将所述特征向量输入至语音分离模型,并获取所述特征向量对应的目标振幅谱,对所述目标振幅谱进行后处理,以获取目标语音信息,可有效快速地将噪声从带噪语音中分离出来,以获取干净的语音信息。
-
公开(公告)号:CN110808058A
公开(公告)日:2020-02-18
申请号:CN201911099098.X
申请日:2019-11-11
申请人: 广州国音智能科技有限公司
IPC分类号: G10L21/02 , G10L21/0208
摘要: 本发明公开了一种语音增强方法、装置、设备和可读存储介质,所述语音增强方法包括:获取待增强语音,并通过预设第一语音增强器对所述待增强语音进行第一语音增强处理,获得第一语音增强处理结果,将所述待增强语音输入预设第二语音增强器,对所述待增强语音进行第二语音增强处理,获得第二语音增强处理结果,对所述第一语音增强处理结果和所述第二语音增强处理结果进行加权求和,获得目标增强语音。本发明解决了语音增强效果差的技术问题。
-
公开(公告)号:CN110798652A
公开(公告)日:2020-02-14
申请号:CN201910990091.0
申请日:2019-10-17
申请人: 广州国音智能科技有限公司
IPC分类号: H04N7/15
摘要: 本发明公开了一种共享屏幕的控制方法,包括以下步骤:本发明在所述视频会议系统与服务器建立通信连接后,所述屏幕共享终端发送屏幕共享数据至所述服务器,以使所述服务器转发所述屏幕共享数据至所述接收终端,而后所述屏幕共享终端在接收到所述服务器转发的屏幕控制请求时,确定所述屏幕共享终端的屏幕对应的第一控制区域,接下来所述屏幕共享终端为所述屏幕控制请求对应的接收终端开放所述第一控制区域的控制权限。本发明还公开了一种装置、终端及可读存储介质。通过服务器转发屏幕控制请求并限定被共享屏幕的控制区域,实现参会者对屏幕的控制,并且在实现视频会议屏幕灵活控制的同时,保证了屏幕共享终端的隐私。
-
公开(公告)号:CN110767229A
公开(公告)日:2020-02-07
申请号:CN201910981040.1
申请日:2019-10-15
申请人: 广州国音智能科技有限公司
摘要: 本发明公开了一种基于声纹的音频输出方法,该方法包括:当接收到音频信息时,获取所述音频信息中的声纹信息,并在声纹数据库中查找与所述声纹信息对应的声纹样本;判断音频数据库中是否存在与所述音频信息对应的音频样本;若所述音频数据库中不存在与所述音频信息对应的音频样本,则向视频识别装置输出唇形获取指令,以获取目标唇形;根据所述目标唇形和所述声纹样本生成目标音频,并将所述目标音频输出。本发明还公开了一种基于声纹的音频输出装置、设备及可读存储介质。本发明实现了在周边环境等不可控因素影响的情况下,提高了音频播放的质量。
-
公开(公告)号:CN110708494A
公开(公告)日:2020-01-17
申请号:CN201910981037.X
申请日:2019-10-15
申请人: 广州国音智能科技有限公司
摘要: 本申请公开了一种视频会议的显示控制方法、终端和计算机可读存储介质,该视频会议的显示控制方法包括通过建立共享应用集合;与服务器和屏幕共享终端建立通信连接;监测屏幕共享数据;判断所述屏幕共享数据来源是否属于所述共享应用集合;若所述数据来源属于共享应用集合,则将所述屏幕共享数据通过所述通信连接发送给服务器和屏幕共享终端;若所述数据来源不属于共享应用集合,则所述屏幕共享数据不发送给服务器和屏幕共享终端。通过共享应用集合对于发起终端可以进行屏幕共享的应用进行限制,不在共享应用集合中的应用的屏幕共享数据无法共享给参与视频会议的其他屏幕共享终端,保护了发起终端的隐私。
-
-
-
-
-
-
-
-
-