-
公开(公告)号:CN113241071B
公开(公告)日:2024-10-01
申请号:CN202110505349.0
申请日:2021-05-10
申请人: 亿咖通(湖北)技术有限公司
摘要: 本申请实施例提供了一种语音处理方法、电子设备及存储介质,涉及计算机技术领域,包括:持续采集语音数据,并获得对持续采集的语音数据进行语音识别得到的文本数据;对持续采集的语音数据进行静音检测;在静音时长达到预设的语音停顿时长后,对已获得的文本数据进行自然语言处理,得到处理结果;在所述静音时长达到所述预设的语音停顿时长、且未达到预设的语音结束时长的情况下,若检测到静音结束,确定所述处理结果无效,其中,所述预设的语音结束时长大于所述预设的语音停顿时长;在所述静音时长达到所述预设的语音结束时长后,将所述处理结果确定为针对持续采集的语音数据的响应结果。应用本申请实施例提供的方案,可以提高语音处理效率。
-
公开(公告)号:CN113571052B
公开(公告)日:2024-09-20
申请号:CN202110832253.5
申请日:2021-07-22
申请人: 亿咖通(湖北)技术有限公司
IPC分类号: G10L15/06 , G10L15/183 , G10L15/22 , G10L15/26
摘要: 本发明实施例提供了一种噪声提取及指令识别方法和电子设备,涉及人工智能技术领域。该方法包括:获取目标语音数据对应的目标文本信息;将所述目标文本信息输入到预先训练的噪声识别模型中,获得所述目标文本信息映射到各个预设噪声标签的预测概率;其中,所述预设噪声标签用于表示预测噪声文本的索引位置,所述预测噪声文本为所述目标文本信息中的词组,所述词组为所述目标文本信息中一个字或连续的多个字的组合;将所述预测概率最大的预设噪声标签对应的所述预测噪声文本确定为所述目标噪声文本。与现有技术相比,应用本发明实施例提供的方案,可以实现在不借助停用词表的情况下,提取待进行自然语言处理的文本中的噪声。
-
公开(公告)号:CN113284499B
公开(公告)日:2024-07-12
申请号:CN202110565053.8
申请日:2021-05-24
申请人: 亿咖通(湖北)技术有限公司
摘要: 本发明实施例提供了一种语音指令识别方法及电子设备,本发明实施例提供的语音识别方法,可以首先获取待识别语音指令的目标文字以及目标拼音,并根据预设的扩展规则获取扩展拼音,扩展拼音包括目标拼音,之后提取目标文字以及扩展拼音的特征,将获取的文字特征以及扩展拼音特征融合,得到融合特征,再基于融合特征识别出待识别语音指令的语义。本发明实施例提供的方法,在分别对待识别语音指令的目标文字以及扩展拼音做特征提取后,再将各特征进行融合,可以获取待识别语音指令更多、更高层的特征(如,语义特征),从而提高了语音指令识别的准确性。
-
公开(公告)号:CN116719988A
公开(公告)日:2023-09-08
申请号:CN202210186824.7
申请日:2022-02-28
申请人: 亿咖通(湖北)技术有限公司
发明人: 李林峰
IPC分类号: G06F16/9532 , G06F16/9535 , G06F16/332 , G06F16/33 , G06F40/35 , G06F40/295 , G06F16/632 , G06F16/635 , G06N3/0442 , G06N3/045 , G06N3/0464 , G06N3/048 , G06N3/08 , G06N20/00 , G06F18/27 , G06F18/243 , G06F18/214
摘要: 本申请提供一种基于语音交互的内容推荐方法、装置、设备及存储介质,涉及语音处理技术领域,该基于语音交互的内容推荐方法包括:获取用户与车机交互的语音信号对应的语音特征;根据语音特征,识别语音信号对应的用户意图;在预设的多个推荐模型中,确定与用户意图对应的目标推荐模型,推荐模型用于推荐对应业务场景的内容;根据语音特征、用户意图和目标推荐模型,获得语音信号对应的推荐内容。本申请能够更加精准地获得推荐结果,且能够提高推荐结果的运算效率。
-
公开(公告)号:CN112686129B
公开(公告)日:2022-05-13
申请号:CN202011580034.4
申请日:2020-12-28
申请人: 亿咖通(湖北)技术有限公司
IPC分类号: G06V40/16 , G06F16/51 , H04L67/1097
摘要: 本发明实施例提供了一种人脸识别系统及方法,涉及人工智能技术领域。系统包括云端服务器和终端;终端用于获取待识别人脸图像;检测所存储的第一人脸识别模型与云端服务器所存储的第二人脸识别模型是否相同;若不同,向云端服务器发送待识别人脸图像;云端服务器用于接收待识别人脸图像;基于第二人脸识别模型对待识别人脸图像进行识别,得到识别结果,向终端发送识别结果;其中,在云端服务器中存储的样本人脸图像库更新时,利用更新后的样本人脸图像库更新第二人脸识别模型;终端还用于接收识别结果。与现有技术相比,应用本发明实施例提供的方案,可以实现在逐渐添加新的参考人脸图像的情况下,终端可以始终获取到具有较高准确度的识别结果。
-
公开(公告)号:CN113743120B
公开(公告)日:2023-07-11
申请号:CN202111042496.5
申请日:2021-09-07
申请人: 亿咖通(湖北)技术有限公司
IPC分类号: G06F40/295 , G06F9/50 , G06N20/00
摘要: 本实申请提供一种语句处理方法及装置,在对语句进行处理的过程中,提取待处理语句中的字词组合,并将字词组合输入到一个机器学习模型后,即可通过一个机器学习模型同时实现对待处理语句进行的断句、获得子语句的意图和获得子语句中命名实体,从而减少了电子设备所设置的机器学习模型的数量,减少了机器学习模型对存储空间的占用,并且还能减少电子设备对语句处理的时间,减少语句处理对电子设备的内存的占用量和占用时间,进而提高了电子设备对语句进行处理的速度和效率。
-
公开(公告)号:CN113822020B
公开(公告)日:2022-07-08
申请号:CN202111381627.2
申请日:2021-11-22
申请人: 亿咖通(湖北)技术有限公司
IPC分类号: G06F40/126 , G06F16/35
摘要: 本申请实施例提供一种文本处理方法、设备、存储介质,将待处理文本输入目标拒识模型,通过目标拒识模型获取待处理文本中每个字符的字符特征和全局位置特征,并根据字符特征和全局位置特征输出待处理文本对应的分类结果。由于目标拒识模型是通过字符特征和全局位置特征训练得到的,其可以准确的获取待处理文本中各字符的含义,以及各字符在待处理文本中的位置关系,从而根据含义和位置关系准确的得出待处理文本所表达的含义,进而准确的推断待处理文本是否为拒识文本,保障人机交互的有效性和流畅性,提升交互体验。
-
公开(公告)号:CN114548093A
公开(公告)日:2022-05-27
申请号:CN202210189244.3
申请日:2022-02-28
申请人: 亿咖通(湖北)技术有限公司
IPC分类号: G06F40/284 , G06F40/295 , G06F40/242 , G06N3/04 , G06N3/08 , G06F16/335
摘要: 本申请提供了一种自然语言处理方法、装置、设备、介质及程序产品,通过获取待解析文本,并利用神经网络模型对待解析文本进行初始解析,以根据初始解析结果确定至少一个语法树,待解析文本与用户输入的自然语言相对应;据语法树对待解析文本进行语法规则解析,以确定二次解析结果;通过预设仲裁列表从初始解析结果以及二次解析结果中筛选出目标解析结果;根据目标解析结果确定并执行目标业务。解决了现有的基于语法规则匹配的自然语言处理方式存在计算量大、资源消耗多、识别效率较低的技术问题。达到了自然语言处理在语法规则匹配时减少计算量,提高识别效率的技术效果。
-
公开(公告)号:CN114548082A
公开(公告)日:2022-05-27
申请号:CN202210193390.3
申请日:2022-02-28
申请人: 亿咖通(湖北)技术有限公司
IPC分类号: G06F40/253 , G06F40/242 , G06F40/35 , G06F16/903
摘要: 本申请提供一种语法解析方法、设备和可读存储介质,将用户的第二级语法规则文件输入预先构建的词典中进行词法分析,获得匹配的词法单元。将词法单元输入预先构建的语法树中进行语法分析,获得词法单元在语法树上的第一匹配路径,将用户输入的语句与第一匹配路径进行匹配,获得第二匹配路径并获得语句的意图。利用第一级语法规则解析第二级语法规则,获得第二级语法规则中的每一个规则在语法树上的路径,而后将用户输入的语句与各个路径进行匹配,获得匹配的路径,且由于每个路径具有对应的意图,从而能够获得语句的意图,实现语句的解析,并且在需要修改用户的第二级语法规则文件时,无需再次生成的词典和语法树,提高语法解析效率。
-
公开(公告)号:CN113220839B
公开(公告)日:2022-05-24
申请号:CN202110523158.7
申请日:2021-05-13
申请人: 亿咖通(湖北)技术有限公司
摘要: 本发明实施例提供了一种意图识别方法、电子设备及计算机可读存储介质,涉及语音处理技术领域,方法包括:利用分类网络模型获取第一语音数据的第一语义特征属于每一预设意图类别的第一概率,基于第一概率,从各个预设意图类别中确定多个目标意图类别;利用每一目标意图类别对应的目标高斯混合模型,获取第一语音数据的第二语义特征属于每一目标意图类别的第二概率;若最大的目标概率大于第二概率阈值,确定目标概率对应的目标意图类别为第一语音数据的实际意图,执行实际意图对应的第一操作;否则,执行用于确认目标概率对应的目标意图类别是否为第一语音数据的实际意图的第二操作。能够降低错误响应语音数据的概率,提高用户体验。
-
-
-
-
-
-
-
-
-