-
公开(公告)号:CN111488203B
公开(公告)日:2023-02-28
申请号:CN202010285868.6
申请日:2020-04-13
申请人: 深圳市友杰智新科技有限公司
摘要: 本申请揭示了一种录音识别任务的处理方法、装置、计算机设备和存储介质,方法包括:在当前执行特定录音识别任务时,判断是否接收到新的指定录音识别任务;若是,暂停执行特定录音识别任务,并存储特定录音识别任务的当前处理状态;执行指定录音识别任务,然后执行除指定录音识别任务外的所有其他录音识别任务,其中,其他录音识别任务包括特定录音识别任务。通过本申请能够立刻对用户触发的新的指定录音请求对应的指定录音识别任务进行处理的同时,也不用丢弃上述特定录音识别任务,有效地提高了在当前执行录音识别任务的过程中对用户此时持有的新的录音识别任务需求进行处理的智能性,保障了用户在使用录音识别功能时的使用体验。
-
公开(公告)号:CN111462753B
公开(公告)日:2023-02-28
申请号:CN202010261284.5
申请日:2020-04-03
申请人: 深圳市友杰智新科技有限公司
IPC分类号: G10L15/26 , G10L15/04 , G10L15/30 , H04L67/568 , H04L67/02
摘要: 本申请揭示了语音识别的方法,包括:根据网络特征参数判断当前链接的网络是否为短链接网络;若是,则启动临时缓存路径;实时获取音频数据;依据所述音频数据按照预设规则通过所述临时缓存路径形成缓存文件;判断所述缓存文件是否满足所述短链接网络的语音识别条件;若是,则将所述缓存文件通过第一接口输入所述短链接网络进行语音识别。通过在音频读取和音频识别的链路之间构建临时缓存路径,以缓存实时获取的音频,以便对其进行实时断句等处理,使得在通过短链接网络进行语音识别时,实现边切句并获取识别结果的实时流式识别,提高识别效率以及识别结果反馈的实时性。
-
公开(公告)号:CN111444731A
公开(公告)日:2020-07-24
申请号:CN202010542456.6
申请日:2020-06-15
申请人: 深圳市友杰智新科技有限公司
摘要: 本申请揭示了模型训练方法,模型包括第一编码器和第二编码器组成的第一孪生网络,方法包括获取第一编码器处理第一数据后输出的第一高维向量,及第二编码器处理第二数据输出的第二高维向量;通过第一损失函数训练第一孪生网络,至第一损失函数达最小值时,第一孪生网络训练收敛;获取第一孪生网络训练收敛时,第一编码器对应的第一参数集合以及第二编码器对应的第二参数集合;将第一参数集合下的第一编码器和第一恢复网络组成第二孪生网络,将第二参数集合下的第二编码器和第二恢复网络组成第三孪生网络;通过第二损失函数分别训练第二孪生网络和第三孪生网络至收敛,得到执行对偶任务的网络模型系统。节省模型构建、训练成本,模型训练得到改善。
-
公开(公告)号:CN111431726A
公开(公告)日:2020-07-17
申请号:CN202010530526.6
申请日:2020-06-11
申请人: 深圳市友杰智新科技有限公司
摘要: 本申请提供一种算法授权方法、装置、计算机设备和存储介质,包括:基于算法库接收客户端发送的算法请求,算法请求中携带有请求字段;检测客户端中是否存储有对应请求字段的授权信息文件;若有,则基于算法库从授权信息文件中得到唯一令牌、随机令牌以及时间戳,并校验时间戳是否过期;若过期,则接收算法库触发的授权请求,检测服务器中是否包括记录请求字段以及唯一令牌的参数表;若包括,检测参数表中的记录的随机令牌与授权信息文件中的随机令牌是否一致;若一致,则返回授权成功响应至所述客户端,并更新参数表中的随机令牌。本申请无需客户端的账户信息,对多个字段分别进行校验,每一次授权之后,均更新随机令牌,避免重复滥用授权信息。
-
公开(公告)号:CN111429923A
公开(公告)日:2020-07-17
申请号:CN202010542435.4
申请日:2020-06-15
申请人: 深圳市友杰智新科技有限公司
摘要: 本申请涉及说话人信息提取模型的训练方法,包括:将语音合成系统与语音识别系统,通过说话人信息提取模型关联为训练体系;从音频处理结果中去除说话人信息提取模型提取语音数据对应的文本内容信息后的剩余数据信息,得到第一高维向量,获取文本处理网络处理第一数据对的文本数据输出的第二高维向量;训练音频处理网络、文本处理网络和说话人信息提取模型,至损失函数达最小值时训练收敛;将音频处理网络和音频恢复网络组合成处理音频的网络,将文本处理网络和文本恢复网络组合成处理文本的网络;训练处理音频的网络和说话人信息提取模型至收敛,以获取说话人信息提取模型的参量集合。提高说话人信息提取模型的泛化能力。
-
公开(公告)号:CN111428867A
公开(公告)日:2020-07-17
申请号:CN202010543541.4
申请日:2020-06-15
申请人: 深圳市友杰智新科技有限公司
摘要: 本申请涉及基于可逆分离卷积的模型训练方法,模型包括处理音频的网络、处理文本的网络,处理音频的网络和处理文本的网络均包括可逆分离卷积层,方法包括:获取处理音频的网络计算训练集中的指定数据对的语音数据,得到的第一高维向量,获取处理文本的网络计算指定数据对的文本数据,得到的第二高维向量,其中训练集由语音数据和文本数据形成的数据对组成,指定数据对为训练集中的任意数据对;通过损失函数在训练集上训练处理音频的网络和处理文本的网络,损失函数为第一高维向量和第二高维向量的空间距离;判断损失函数是否达到最小值;若是则判定训练收敛,得到由处理音频的网络和处理文本的网络组成的孪生网络结构。节省模型构建、训练成本。
-
公开(公告)号:CN111462753A
公开(公告)日:2020-07-28
申请号:CN202010261284.5
申请日:2020-04-03
申请人: 深圳市友杰智新科技有限公司
摘要: 本申请揭示了语音识别的方法,包括:根据网络特征参数判断当前链接的网络是否为短链接网络;若是,则启动临时缓存路径;实时获取音频数据;依据所述音频数据按照预设规则通过所述临时缓存路径形成缓存文件;判断所述缓存文件是否满足所述短链接网络的语音识别条件;若是,则将所述缓存文件通过第一接口输入所述短链接网络进行语音识别。通过在音频读取和音频识别的链路之间构建临时缓存路径,以缓存实时获取的音频,以便对其进行实时断句等处理,使得在通过短链接网络进行语音识别时,实现边切句并获取识别结果的实时流式识别,提高识别效率以及识别结果反馈的实时性。
-
公开(公告)号:CN109190133B
公开(公告)日:2023-05-09
申请号:CN201811322416.X
申请日:2018-11-08
申请人: 深圳市友杰智新科技有限公司
发明人: 温平
IPC分类号: G06F40/58
摘要: 本发明涉及翻译机技术领域,公开了一种翻译语言自动切换方法及装置,该方法包括:获取翻译机的IP地址信息,并将所述IP地址信息上传至服务器;解析所述IP地址信息,获得所述翻译机所在的位置信息;根据所述位置信息自动切换所述翻译机的翻译语言;通过IP地址信息判断翻译机当前所在的国家和地区,不需要实时监测,降低功耗,提高了用户体验。
-
公开(公告)号:CN111583913B
公开(公告)日:2020-11-03
申请号:CN202010543542.9
申请日:2020-06-15
申请人: 深圳市友杰智新科技有限公司
IPC分类号: G10L15/06 , G10L15/26 , G10L13/047 , G10L15/16 , G10L25/30
摘要: 本申请涉及的语音识别和语音合成的模型训练方法,包括:获取音频处理网络处理训练集中的第一数据对的语音数据后输出的第一高维向量,获取文本处理网络处理第一数据对的文本数据输出的第二高维向量;通过损失函数在训练集上训练音频处理网络和文本处理网络至训练收敛;训练收敛后,固定音频处理网络对应的第一参量集合以及文本处理网络对应的第二参量集合;第一参量集合和第二参量集合下,训练文本恢复网络和音频恢复网络至收敛;将音频处理网络和文本恢复网络,依次组合连接得到语音识别的声学预训练模型,将文本处理网络和音频恢复网络,依次组合连接得到语音合成的声学预训练模型。节省模型构建、训练成本。
-
公开(公告)号:CN111444731B
公开(公告)日:2020-11-03
申请号:CN202010542456.6
申请日:2020-06-15
申请人: 深圳市友杰智新科技有限公司
摘要: 本申请揭示了模型训练方法,模型包括第一编码器和第二编码器组成的第一孪生网络,方法包括获取第一编码器处理第一数据后输出的第一高维向量,及第二编码器处理第二数据输出的第二高维向量;通过第一损失函数训练第一孪生网络,至第一损失函数达最小值时,第一孪生网络训练收敛;获取第一孪生网络训练收敛时,第一编码器对应的第一参数集合以及第二编码器对应的第二参数集合;将第一参数集合下的第一编码器和第一恢复网络组成第二孪生网络,将第二参数集合下的第二编码器和第二恢复网络组成第三孪生网络;通过第二损失函数分别训练第二孪生网络和第三孪生网络至收敛,得到执行对偶任务的网络模型系统。节省模型构建、训练成本,模型训练得到改善。
-
-
-
-
-
-
-
-
-