语音数据标注方法及电子设备、存储装置

    公开(公告)号:CN113160800B

    公开(公告)日:2022-12-06

    申请号:CN202110158767.7

    申请日:2021-02-04

    Abstract: 本申请公开了语音数据标注方法及电子设备、存储装置,该方法包括:获取第一语音数据中的高混淆度数据,高混淆度数据为混淆度值超过阈值的数据;提取高混淆度数据的语义特征,并获取与语义特征接近的多个近似数据;利用第一意图分类模型对近似数据进行预测,以获得近似数据的意图分类结果;将高混淆度数据所标注的意图修正为近似数据的意图分类结果中占比达到预设比值的意图,以得到修正后的第一语音数据;利用修正后的第一语音数据对第一意图分类模型进行训练,以获得第二意图分类模型;利用第二意图分类模型对第二语音数据进行预测,以获得第二语音数据对应的意图分类结果。上述方案,能够实现语音数据进行意图标注的标准化,提高标注的准确率。

    语音识别方法以及电子设备、存储装置

    公开(公告)号:CN112700768A

    公开(公告)日:2021-04-23

    申请号:CN202011487548.5

    申请日:2020-12-16

    Abstract: 本申请公开了一种语音识别方法以及电子设备、存储装置,其中,语音识别方法包括:识别用户的语音指令,得到一个第一候选文本和至少一个第二候选文本;其中,第二候选文本的识别置信度与第一候选文本的识别置信度符合预设关系;响应于第一候选文本的第一语义理解结果不满足预设结果条件,更新第二候选文本的识别置信度;基于识别置信度,获取第二候选文本的第二语义理解结果,并利用第二语义理解结果,得到语音指令的识别结果。上述方案,能够提高语音识别的准确性和鲁棒性。

    语音识别方法以及电子设备、存储装置

    公开(公告)号:CN112700768B

    公开(公告)日:2024-04-26

    申请号:CN202011487548.5

    申请日:2020-12-16

    Abstract: 本申请公开了一种语音识别方法以及电子设备、存储装置,其中,语音识别方法包括:识别用户的语音指令,得到一个第一候选文本和至少一个第二候选文本;其中,第二候选文本的识别置信度与第一候选文本的识别置信度符合预设关系;响应于第一候选文本的第一语义理解结果不满足预设结果条件,更新第二候选文本的识别置信度;基于识别置信度,获取第二候选文本的第二语义理解结果,并利用第二语义理解结果,得到语音指令的识别结果。上述方案,能够提高语音识别的准确性和鲁棒性。

    语音数据标注方法及电子设备、存储装置

    公开(公告)号:CN113160800A

    公开(公告)日:2021-07-23

    申请号:CN202110158767.7

    申请日:2021-02-04

    Abstract: 本申请公开了语音数据标注方法及电子设备、存储装置,该方法包括:获取第一语音数据中的高混淆度数据,高混淆度数据为混淆度值超过阈值的数据;提取高混淆度数据的语义特征,并获取与语义特征接近的多个近似数据;利用第一意图分类模型对近似数据进行预测,以获得近似数据的意图分类结果;将高混淆度数据所标注的意图修正为近似数据的意图分类结果中占比达到预设比值的意图,以得到修正后的第一语音数据;利用修正后的第一语音数据对第一意图分类模型进行训练,以获得第二意图分类模型;利用第二意图分类模型对第二语音数据进行预测,以获得第二语音数据对应的意图分类结果。上述方案,能够实现语音数据进行意图标注的标准化,提高标注的准确率。

Patent Agency Ranking