语音唤醒方法、电子设备及非暂态计算机可读存储介质

    公开(公告)号:CN109215647A

    公开(公告)日:2019-01-15

    申请号:CN201811004154.2

    申请日:2018-08-30

    发明人: 李深 胡亚光

    IPC分类号: G10L15/22 G10L15/02 G10L25/24

    摘要: 本发明实施例提供了一种语音唤醒方法、电子设备及非暂态计算机可读存储介质,应用于语音识别技术领域。该方法包括:向第一语音识别模型中依次输入从语音信号中提取到的音频特征,当确定音频特征的置信度达到第一置信度阈值且未达到第一唤醒阈值时,向第一语音识别模型依次输入第二音频特征,且向第二语音识别模型依次输入确定出的待输入至第二语音识别模型中的第一音频特征,当满足第一预设条件时,确定执行唤醒操作,其中,第一预设条件包括:第一语音识别模型检测第二音频特征时,检测到置信度达到第一唤醒阈值,和/或,第二语音识别模型检测第一音频特征时,检测到置信度达到第二唤醒阈值。本发明实施例实现了如何实现语音唤醒。

    唤醒词识别方法、装置、电子设备及计算机可读存储介质

    公开(公告)号:CN109065044A

    公开(公告)日:2018-12-21

    申请号:CN201811004169.9

    申请日:2018-08-30

    发明人: 胡亚光

    IPC分类号: G10L15/22 G10L15/02

    摘要: 本发明实施例涉及语音处理领域,提供了一种唤醒词识别方法、装置、电子设备及计算机可读存储介质,其中,唤醒词识别方法包括:获取用户输入的待识别的语音信息;接着基于预设的语音识别模型,确定语音信息对应的第一音节序列;接着确定第一音节序列中是否包括预设唤醒词的第二音节序列;接着若包括,则确定语音信息中包括预设唤醒词,并执行相应的唤醒操作。本发明实施例的方法,根据音节序列即可识别出语音信息中是否包括唤醒词,而无需识别语音信息中是否包括唤醒词的字或词语,从而使得语音识别模型无需随着唤醒词的更改而更改,可以固定不变,极大降低设计的复杂度及研发成本。

    一种确定说话人特征的方法及装置

    公开(公告)号:CN108899033B

    公开(公告)日:2021-09-10

    申请号:CN201810501729.5

    申请日:2018-05-23

    发明人: 胡亚光 李志飞

    摘要: 本发明实施例公开了一种确定说话人特征的方法及装置,涉及数据处理技术领域,能够根据说话人提供的声音文本数据识别并确定说话人具有的特征信息,以便于开发人员依据得到的说话人特征能够更加有针对性地改进当前的智能化服务,以便于大大提高向说话人推送的个性化服务方案的应用价值。本发明实施例主要技术方案为:接收声音文本数据;从所述声音文本数据中提取声纹特征数据;利用预置模型对所述声纹特征数据进行处理,根据所述预置模型的输出数据,确定与所述声纹特征数据匹配的说话人特征。本发明实施例主要用于根据声音文本数据识别并确定说话人具有的特征信息。

    唤醒词识别方法、装置、电子设备及计算机可读存储介质

    公开(公告)号:CN109065044B

    公开(公告)日:2021-04-02

    申请号:CN201811004169.9

    申请日:2018-08-30

    发明人: 胡亚光

    IPC分类号: G10L15/22 G10L15/02

    摘要: 本发明实施例涉及语音处理领域,提供了一种唤醒词识别方法、装置、电子设备及计算机可读存储介质,其中,唤醒词识别方法包括:获取用户输入的待识别的语音信息;接着基于预设的语音识别模型,确定语音信息对应的第一音节序列;接着确定第一音节序列中是否包括预设唤醒词的第二音节序列;接着若包括,则确定语音信息中包括预设唤醒词,并执行相应的唤醒操作。本发明实施例的方法,根据音节序列即可识别出语音信息中是否包括唤醒词,而无需识别语音信息中是否包括唤醒词的字或词语,从而使得语音识别模型无需随着唤醒词的更改而更改,可以固定不变,极大降低设计的复杂度及研发成本。

    唤醒词的更新方法、装置及电子设备

    公开(公告)号:CN108986813A

    公开(公告)日:2018-12-11

    申请号:CN201811014878.5

    申请日:2018-08-31

    发明人: 胡亚光 周羊

    IPC分类号: G10L15/22 G10L15/26

    摘要: 本发明实施例公开了一种唤醒词的更新方法、装置及电子设备。其中,方法包括:接收到第一语音信息时,确定针对第一语音信息的处理方式;若针对第一语音信息的处理方式为更新唤醒词时,从第一语音信息中确定目标发音序列;依据目标发音序列更新唤醒终端设备的原有唤醒词。本发明实施例解决了现有技术中唤醒词固定,用户无法自定义终端设备唤醒词的技术问题,保证了更新后的终端设备的唤醒词符合用户习惯,防止因唤醒词不符合用户习惯导致用户忘记唤醒词或无法准确说出唤醒词而导致的终端设备无法被唤醒的风险。

    媒体访问的控制方法、装置及电子设备

    公开(公告)号:CN108830059A

    公开(公告)日:2018-11-16

    申请号:CN201810502700.9

    申请日:2018-05-23

    发明人: 胡亚光 李志飞

    IPC分类号: G06F21/32 G06F17/30

    摘要: 本发明实施例公开了一种媒体访问的控制方法、装置及电子设备,涉及终端应用技术领域,主要目的在于通过声纹特征识别的不同的年龄段,实现目标媒体内容的分级控制管理。本发明实施例的主要技术方案包括:获取语音搜索指令后,提取语音搜索指令中包含的第一声纹特征;所述语音搜索指令用于访问目标媒体内容,所述目标媒体内容拥有年龄访问标签;根据所述第一声纹特征判断对应的年龄;若所述第一声纹特征判断对应的年龄符合所述年龄访问标签,则响应所述语音搜索指令。

    一种身份验证方法及装置

    公开(公告)号:CN108712381A

    公开(公告)日:2018-10-26

    申请号:CN201810341816.9

    申请日:2018-04-16

    IPC分类号: H04L29/06

    摘要: 本发明公开了一种身份验证方法及装置,涉及数据处理技术领域,本发明的方法包括:当监测到待验证对象时,获取与所述待验证对象对应的多个特征参数;依次生成与所述各个特征参数分别对应的特征向量;根据所述特征向量计算与所述待验证对象对应的验证值;根据所述验证值确定所述待验证对象身份。实现了通过多模态对用户身份进行验证,提高了用户身份验证的准确性。

    一种确定说话人特征的方法及装置

    公开(公告)号:CN108899033A

    公开(公告)日:2018-11-27

    申请号:CN201810501729.5

    申请日:2018-05-23

    发明人: 胡亚光 李志飞

    摘要: 本发明实施例公开了一种确定说话人特征的方法及装置,涉及数据处理技术领域,能够根据说话人提供的声音文本数据识别并确定说话人具有的特征信息,以便于开发人员依据得到的说话人特征能够更加有针对性地改进当前的智能化服务,以便于大大提高向说话人推送的个性化服务方案的应用价值。本发明实施例主要技术方案为:接收声音文本数据;从所述声音文本数据中提取声纹特征数据;利用预置模型对所述声纹特征数据进行处理,根据所述预置模型的输出数据,确定与所述声纹特征数据匹配的说话人特征。本发明实施例主要用于根据声音文本数据识别并确定说话人具有的特征信息。