数字孪生声纹特征处理方法、存储介质及电子装置

    公开(公告)号:CN115171702A

    公开(公告)日:2022-10-11

    申请号:CN202210603562.X

    申请日:2022-05-30

    Abstract: 本申请公开了一种数字孪生声纹特征处理方法、存储介质及电子装置,涉及智慧家庭技术领域,其中,该方法包括:获取到待处理的多条语音数据,每条语音数据为一组智能设备中的一个智能设备所采集到的、通过声纹特征未识别到匹配的对象信息的语音数据;对多条语音数据执行声源分离处理,得到至少一个目标语音组,每个目标语音组包含多条语音数据中属于一个声源的至少两条语音数据;对每个目标语音组中的语音数据执行声纹特征提取操作,得到至少一个声纹特征,至少一个声纹特征为待确定对应的对象信息的声纹特征。通过本申请,解决了相关技术中的声纹特征的处理方式存在由于录入的声纹特征精准度低导致的用户身份识别的准确性差的问题。

    数字孪生声纹特征处理方法、存储介质及电子装置

    公开(公告)号:CN115171702B

    公开(公告)日:2024-09-24

    申请号:CN202210603562.X

    申请日:2022-05-30

    Abstract: 本申请公开了一种数字孪生声纹特征处理方法、存储介质及电子装置,涉及智慧家庭技术领域,其中,该方法包括:获取到待处理的多条语音数据,每条语音数据为一组智能设备中的一个智能设备所采集到的、通过声纹特征未识别到匹配的对象信息的语音数据;对多条语音数据执行声源分离处理,得到至少一个目标语音组,每个目标语音组包含多条语音数据中属于一个声源的至少两条语音数据;对每个目标语音组中的语音数据执行声纹特征提取操作,得到至少一个声纹特征,至少一个声纹特征为待确定对应的对象信息的声纹特征。通过本申请,解决了相关技术中的声纹特征的处理方式存在由于录入的声纹特征精准度低导致的用户身份识别的准确性差的问题。

    一种语音的语义解析方法及装置

    公开(公告)号:CN112735394B

    公开(公告)日:2022-12-30

    申请号:CN202011488961.3

    申请日:2020-12-16

    Inventor: 苏腾荣 朱文博

    Abstract: 本发明提供了一种语音的语义解析方法及装置,其中,该方法包括:获取语音数据的多个文本识别结果,以及该多个文本识别结果对应的音素识别结果;从该多个文本识别结果中获取置信度最高的目标识别结果;根据该目标识别结果确定该语音数据所属的领域分类结果;在该语音数据所属的预设文本领域中,根据该多个文本识别结果,以及该多个文本识别结果对应的音素识别结果确定该语音数据的音乐名称,可以解决相关技术中由于同音字只能通过纠错发送处理,语音交互系统在音乐名称识别准确性低,使得交互成功率较低的问题,提高了音乐名称识别的准确性,也提升用户在音乐领域交互时的交互成功率。

    终端设备唤醒方法和装置、存储介质及电子装置

    公开(公告)号:CN113593546A

    公开(公告)日:2021-11-02

    申请号:CN202110714965.7

    申请日:2021-06-25

    Abstract: 本发明公开了一种终端设备唤醒方法和装置、存储介质及电子装置,其中,上述方法包括:获取待识别的音频数据;在终端设备内配置的至少两个唤醒模型的每个唤醒模型中,基于各自从音频数据中提取的不同维度下的音频特征分别进行唤醒识别,得到与唤醒模型对应的音频识别结果,其中,每个唤醒模型用于提取一种维度下的音频特征;在音频识别结果达到唤醒条件的情况下,将终端设备调整为唤醒状态。采用上述技术方案,解决了现有技术中终端设备的唤醒性能差的问题。

    语音数据的处理方法及装置、存储介质、电子装置

    公开(公告)号:CN113593535B

    公开(公告)日:2024-05-24

    申请号:CN202110744802.3

    申请日:2021-06-30

    Inventor: 朱文博

    Abstract: 本发明提供了一种语音数据的处理方法及装置、存储介质、电子装置,上述方法包括:获取待处理的语音数据;根据多个预设语音模型中各预设语音模型对应的权重,从多个预设语音模型中确定至少一个目标语音模型,各预设语音模型的权重表征该预设语音模型识别结果的置信度;通过至少一个目标语音模型对待处理的语音数据进行处理,解决了现有技术中在使用多种语音识别引擎(即语音模型)进行语音识别时,识别时间长,无法确定识别结果的准确率等问题,确保了语音数据进行识别的灵活性,提升对于识别准确率的确定时间。

    音频注册方法、装置和存储介质及电子装置

    公开(公告)号:CN116524935A

    公开(公告)日:2023-08-01

    申请号:CN202310344225.8

    申请日:2023-03-31

    Inventor: 王祖悦 朱文博

    Abstract: 本申请公开了一种音频注册方法、装置和存储介质及电子装置,涉及智能家居/智慧家庭技术领域,该音频注册方法包括:获取至少一个智能设备采集到的初始音频数据,并从初始音频数据中筛选出未注册的音频数据;按照未注册的音频数据中各个音频数据之间的音频相似度,将未注册的音频数据划分为至少两类音频数据,其中,至少两类音频数据中的各类音频数据对应不同的、未注册的第一用户标签;基于至少两类音频数据,对第一用户标签进行注册,并生成第一用户标签对应的用户画像,其中,至少一个智能设备在接收到第一用户标签触发的控制指令时,将执行第一用户标签对应的用户画像匹配的智能操作。本申请解决了音频注册准确性较低的技术问题。

    语音数据的处理方法及装置、存储介质、电子装置

    公开(公告)号:CN113593535A

    公开(公告)日:2021-11-02

    申请号:CN202110744802.3

    申请日:2021-06-30

    Inventor: 朱文博

    Abstract: 本发明提供了一种语音数据的处理方法及装置、存储介质、电子装置,上述方法包括:获取待处理的语音数据;根据多个预设语音模型中各预设语音模型对应的权重,从多个预设语音模型中确定至少一个目标语音模型,各预设语音模型的权重表征该预设语音模型识别结果的置信度;通过至少一个目标语音模型对待处理的语音数据进行处理,解决了现有技术中在使用多种语音识别引擎(即语音模型)进行语音识别时,识别时间长,无法确定识别结果的准确率等问题,确保了语音数据进行识别的灵活性,提升对于识别准确率的确定时间。

    一种语音的语义解析方法及装置

    公开(公告)号:CN112735394A

    公开(公告)日:2021-04-30

    申请号:CN202011488961.3

    申请日:2020-12-16

    Inventor: 苏腾荣 朱文博

    Abstract: 本发明提供了一种语音的语义解析方法及装置,其中,该方法包括:获取语音数据的多个文本识别结果,以及该多个文本识别结果对应的音素识别结果;从该多个文本识别结果中获取置信度最高的目标识别结果;根据该目标识别结果确定该语音数据所属的领域分类结果;在该语音数据所属的预设文本领域中,根据该多个文本识别结果,以及该多个文本识别结果对应的音素识别结果确定该语音数据的音乐名称,可以解决相关技术中由于同音字只能通过纠错发送处理,语音交互系统在音乐名称识别准确性低,使得交互成功率较低的问题,提高了音乐名称识别的准确性,也提升用户在音乐领域交互时的交互成功率。

Patent Agency Ranking