-
公开(公告)号:CN112700768B
公开(公告)日:2024-04-26
申请号:CN202011487548.5
申请日:2020-12-16
申请人: 科大讯飞股份有限公司 , 吉林科讯信息科技有限公司
摘要: 本申请公开了一种语音识别方法以及电子设备、存储装置,其中,语音识别方法包括:识别用户的语音指令,得到一个第一候选文本和至少一个第二候选文本;其中,第二候选文本的识别置信度与第一候选文本的识别置信度符合预设关系;响应于第一候选文本的第一语义理解结果不满足预设结果条件,更新第二候选文本的识别置信度;基于识别置信度,获取第二候选文本的第二语义理解结果,并利用第二语义理解结果,得到语音指令的识别结果。上述方案,能够提高语音识别的准确性和鲁棒性。
-
公开(公告)号:CN112700768A
公开(公告)日:2021-04-23
申请号:CN202011487548.5
申请日:2020-12-16
申请人: 科大讯飞股份有限公司 , 吉林科讯信息科技有限公司
摘要: 本申请公开了一种语音识别方法以及电子设备、存储装置,其中,语音识别方法包括:识别用户的语音指令,得到一个第一候选文本和至少一个第二候选文本;其中,第二候选文本的识别置信度与第一候选文本的识别置信度符合预设关系;响应于第一候选文本的第一语义理解结果不满足预设结果条件,更新第二候选文本的识别置信度;基于识别置信度,获取第二候选文本的第二语义理解结果,并利用第二语义理解结果,得到语音指令的识别结果。上述方案,能够提高语音识别的准确性和鲁棒性。
-
公开(公告)号:CN113160800B
公开(公告)日:2022-12-06
申请号:CN202110158767.7
申请日:2021-02-04
申请人: 吉林科讯信息科技有限公司
摘要: 本申请公开了语音数据标注方法及电子设备、存储装置,该方法包括:获取第一语音数据中的高混淆度数据,高混淆度数据为混淆度值超过阈值的数据;提取高混淆度数据的语义特征,并获取与语义特征接近的多个近似数据;利用第一意图分类模型对近似数据进行预测,以获得近似数据的意图分类结果;将高混淆度数据所标注的意图修正为近似数据的意图分类结果中占比达到预设比值的意图,以得到修正后的第一语音数据;利用修正后的第一语音数据对第一意图分类模型进行训练,以获得第二意图分类模型;利用第二意图分类模型对第二语音数据进行预测,以获得第二语音数据对应的意图分类结果。上述方案,能够实现语音数据进行意图标注的标准化,提高标注的准确率。
-
公开(公告)号:CN113160800A
公开(公告)日:2021-07-23
申请号:CN202110158767.7
申请日:2021-02-04
申请人: 吉林科讯信息科技有限公司
摘要: 本申请公开了语音数据标注方法及电子设备、存储装置,该方法包括:获取第一语音数据中的高混淆度数据,高混淆度数据为混淆度值超过阈值的数据;提取高混淆度数据的语义特征,并获取与语义特征接近的多个近似数据;利用第一意图分类模型对近似数据进行预测,以获得近似数据的意图分类结果;将高混淆度数据所标注的意图修正为近似数据的意图分类结果中占比达到预设比值的意图,以得到修正后的第一语音数据;利用修正后的第一语音数据对第一意图分类模型进行训练,以获得第二意图分类模型;利用第二意图分类模型对第二语音数据进行预测,以获得第二语音数据对应的意图分类结果。上述方案,能够实现语音数据进行意图标注的标准化,提高标注的准确率。
-
公开(公告)号:CN118898293A
公开(公告)日:2024-11-05
申请号:CN202410838464.3
申请日:2024-06-26
申请人: 科大讯飞股份有限公司
IPC分类号: G06N5/04 , G06F16/332 , G06F18/22 , G06N5/022
摘要: 本申请提供一种知识数据的处理方法、装置、设备、介质及产品,该方法包括:从知识库中获取与用户的知识请求相关的多个候选知识检索结果;基于多个候选知识检索结果的置信度以及多个候选知识检索结果各自与知识请求之间的相关度,从多个候选知识检索结果中确定出用于响应知识请求的目标知识检索结果;置信度是根据历史知识检索过程中对知识的正确性评价结果而确定的;通过大模型基于目标知识检索结果生成知识请求对应的回复内容,从而提升回复内容的准确性和合理性。
-
公开(公告)号:CN112700769B
公开(公告)日:2024-07-05
申请号:CN202011569220.8
申请日:2020-12-26
申请人: 中国科学技术大学 , 科大讯飞股份有限公司
IPC分类号: G10L15/18 , G10L15/183 , G10L15/26
摘要: 本申请公开了一种语义理解方法、装置、设备以及计算机可读存储介质,该方法包括:在获取到当前语音段之后,先对该当前语音段进行语音识别,得到当前文本段;再根据该当前文本段和该当前文本段对应的未识别文本段,生成待识别文本段,以便在确定该待识别文本段包括完整性语句之后,对该待识别文本段进行语义理解。其中,因当前语音段是指在当前时刻下实时采集的用户语音,使得本申请提供的语义理解方法能够针对实时采集的用户语音进行实时地语义理解,从而能够实现边采集用户语音边进行语义理解的目的,如此能够提高语义理解的实时性,从而能够提高人机交互设备的反馈实时性。
-
公开(公告)号:CN118094445A
公开(公告)日:2024-05-28
申请号:CN202410490748.8
申请日:2024-04-23
申请人: 科大讯飞股份有限公司
IPC分类号: G06F18/2433 , G06F18/241 , G06F18/213 , G06N3/0455 , G06N3/08
摘要: 本申请公开了一种基于大模型的人机交互方法、装置、设备及程序产品,属于人工智能技术领域,本申请利用人工智能大模型的能力,结合人机交互历史来确定用户当前的输入请求在各目标维度上的特征值,该目标维度为与衡量用户输入请求是否属于误触发相关的度量维度,综合考虑各目标维度上的特征值,决策用户当前的输入请求是否属于误触发交互,在确定不属于误触发时输出与用户当前的输入请求对应的响应结果。可以有效提升误触发的识别准确度。在识别到用户当前输入请求不属于误触发时,才输出响应结果,保证人机交互的顺畅度,提升了交互体验。
-
公开(公告)号:CN117896460A
公开(公告)日:2024-04-16
申请号:CN202311386093.1
申请日:2023-10-23
申请人: 科大讯飞股份有限公司
IPC分类号: H04M1/72433 , H04M1/72451 , H04M1/72469
摘要: 本申请实施例提供了一种备忘录生成方法、装置、电子设备、车辆和介质。所述备忘录生成方法包括在通话中,响应于检测到触摸屏上输出的通话控制界面上的录制备忘录的控件被触摸,录制所述通话中的通话语音;在所述通话终止或在所述通话中检测到所述录制备忘录的控件被再次触摸的情况下,在触摸屏上输出所述备忘录事项已生成的提示弹窗,所述备忘录事项是根据待办事项生成的,所述待办事项是根据所述通话语音得到的;响应于检测到所述提示弹窗上的查看控件被触摸,在所述触摸屏上输出备忘录详情界面,并在所述备忘录详情界面中显示所述待办事项。
-
公开(公告)号:CN117687594A
公开(公告)日:2024-03-12
申请号:CN202311386074.9
申请日:2023-10-23
申请人: 科大讯飞股份有限公司
IPC分类号: G06F3/16 , G06F16/438 , G06F16/435 , G06F16/45 , G06F16/483 , G10L15/16 , G10L15/18 , G06V40/16 , G10L25/63 , G06F40/30 , G06N3/0455
摘要: 本申请公开了一种音频播放方法及相关装置、设备和存储介质,其中,音频播放方法包括:生成与目标音频中目标语句内容匹配的音频配图;在目标语句的播放过程中显示音频配图。上述方案,能够提高音频播放的趣味性和沉浸感。
-
公开(公告)号:CN117648401A
公开(公告)日:2024-03-05
申请号:CN202311423694.5
申请日:2023-10-27
申请人: 科大讯飞股份有限公司
IPC分类号: G06F16/33 , G06F16/31 , G06F16/34 , G06N5/02 , G06F16/215
摘要: 本申请公开了一种知识库构建方法和知识检索方法及相关装置、设备。该方法包括:基于词条实体的知识文档,构建关于词条实体的知识篇章;基于目标业务场景下的参考信息分别与各个知识篇章之间的匹配结果,选择知识篇章作为目标篇章;其中,参考信息包括历史问题、目标实体中至少一者;基于目标篇章,构建目标业务场景的知识库。上述方法,能够在尽可能降低知识库存储压力的情况下,提高知识库中所包含的知识篇章的有效性,以尽可能地满足特定用户的检索需求。
-
-
-
-
-
-
-
-
-