专利检索 ap:("出门问问信息科技有限公司") AND inv:"胡亚光" 第 1 页

1.

发明公开
语音唤醒方法、电子设备及非暂态计算机可读存储介质无效

公开(公告)号：CN109215647A

公开(公告)日：2019-01-15

申请号：CN201811004154.2

申请日：2018-08-30

申请人： 出门问问信息科技有限公司

发明人： 李深 , 胡亚光

IPC分类号： G10L15/22 , G10L15/02 , G10L25/24

摘要： 本发明实施例提供了一种语音唤醒方法、电子设备及非暂态计算机可读存储介质，应用于语音识别技术领域。该方法包括：向第一语音识别模型中依次输入从语音信号中提取到的音频特征，当确定音频特征的置信度达到第一置信度阈值且未达到第一唤醒阈值时，向第一语音识别模型依次输入第二音频特征，且向第二语音识别模型依次输入确定出的待输入至第二语音识别模型中的第一音频特征，当满足第一预设条件时，确定执行唤醒操作，其中，第一预设条件包括：第一语音识别模型检测第二音频特征时，检测到置信度达到第一唤醒阈值，和/或，第二语音识别模型检测第一音频特征时，检测到置信度达到第二唤醒阈值。本发明实施例实现了如何实现语音唤醒。

2.

发明公开
唤醒词识别方法、装置、电子设备及计算机可读存储介质有权

公开(公告)号：CN109065044A

公开(公告)日：2018-12-21

申请号：CN201811004169.9

申请日：2018-08-30

申请人： 出门问问信息科技有限公司

发明人： 胡亚光

IPC分类号： G10L15/22 , G10L15/02

CPC分类号： G10L15/22 , G10L15/02 , G10L2015/027 , G10L2015/223

摘要： 本发明实施例涉及语音处理领域，提供了一种唤醒词识别方法、装置、电子设备及计算机可读存储介质，其中，唤醒词识别方法包括：获取用户输入的待识别的语音信息；接着基于预设的语音识别模型，确定语音信息对应的第一音节序列；接着确定第一音节序列中是否包括预设唤醒词的第二音节序列；接着若包括，则确定语音信息中包括预设唤醒词，并执行相应的唤醒操作。本发明实施例的方法，根据音节序列即可识别出语音信息中是否包括唤醒词，而无需识别语音信息中是否包括唤醒词的字或词语，从而使得语音识别模型无需随着唤醒词的更改而更改，可以固定不变，极大降低设计的复杂度及研发成本。

3.

发明公开
语音识别的方法、装置、电子设备及计算机可读存储介质无效

公开(公告)号：CN109065036A

公开(公告)日：2018-12-21

申请号：CN201811005437.9

申请日：2018-08-30

申请人： 出门问问信息科技有限公司

发明人： 胡亚光

IPC分类号： G10L15/20 , G10L15/02 , G10L15/22

CPC分类号： G10L15/20 , G10L15/02 , G10L15/22 , G10L2015/027 , G10L2015/223

摘要： 本发明实施例提供了一种语音识别的方法、装置、电子设备及计算机可读存储介质。该方法包括：基于当前环境中的声音，确定当前环境是否属于静音状态，当确定出当前环境不属于静音状态时，通过第一模型和/或第二模型，确定当前环境中的声音是否属于预设噪声，若确定出当前环境中的声音不属于预设噪声，则触发通过语音模型进行关键词检测。本发明实施例降低了误触发的概率，并降低了采集装置以及关键词检测装置的处理压力，进而可以提升用户体验。

4.

发明授权
一种声纹神经网络模型的训练方法、装置及存储介质有权

公开(公告)号：CN110942777B

公开(公告)日：2022-03-08

申请号：CN201911234038.4

申请日：2019-12-05

申请人： 出门问问信息科技有限公司

发明人： 郭理勇 , 胡亚光 , 汪剑

IPC分类号： G10L17/18 , G10L17/04

摘要： 本发明公开了一种声纹神经网络模型的训练方法、装置及存储介质，首先采集语音训练样本；接着对所述语音训练样本进行特征提取，获得语音训练数据；进一步利用一维卷积网络结构和残差网络结构结合的方式来构建神经网络模型；最后利用所获得的语音训练数据对所述神经网络模型进行训练，得到训练好的声纹神经网络模型。

5.

发明授权
一种确定说话人特征的方法及装置有权

公开(公告)号：CN108899033B

公开(公告)日：2021-09-10

申请号：CN201810501729.5

申请日：2018-05-23

申请人： 出门问问信息科技有限公司

发明人： 胡亚光 , 李志飞

IPC分类号： G10L17/02 , G10L17/04 , G10L17/18 , G10L15/26

摘要： 本发明实施例公开了一种确定说话人特征的方法及装置，涉及数据处理技术领域，能够根据说话人提供的声音文本数据识别并确定说话人具有的特征信息，以便于开发人员依据得到的说话人特征能够更加有针对性地改进当前的智能化服务，以便于大大提高向说话人推送的个性化服务方案的应用价值。本发明实施例主要技术方案为：接收声音文本数据；从所述声音文本数据中提取声纹特征数据；利用预置模型对所述声纹特征数据进行处理，根据所述预置模型的输出数据，确定与所述声纹特征数据匹配的说话人特征。本发明实施例主要用于根据声音文本数据识别并确定说话人具有的特征信息。

6.

发明授权
唤醒词识别方法、装置、电子设备及计算机可读存储介质有权

公开(公告)号：CN109065044B

公开(公告)日：2021-04-02

申请号：CN201811004169.9

申请日：2018-08-30

申请人： 出门问问信息科技有限公司

发明人： 胡亚光

IPC分类号： G10L15/22 , G10L15/02

摘要： 本发明实施例涉及语音处理领域，提供了一种唤醒词识别方法、装置、电子设备及计算机可读存储介质，其中，唤醒词识别方法包括：获取用户输入的待识别的语音信息；接着基于预设的语音识别模型，确定语音信息对应的第一音节序列；接着确定第一音节序列中是否包括预设唤醒词的第二音节序列；接着若包括，则确定语音信息中包括预设唤醒词，并执行相应的唤醒操作。本发明实施例的方法，根据音节序列即可识别出语音信息中是否包括唤醒词，而无需识别语音信息中是否包括唤醒词的字或词语，从而使得语音识别模型无需随着唤醒词的更改而更改，可以固定不变，极大降低设计的复杂度及研发成本。

7.

发明公开
唤醒词的更新方法、装置及电子设备无效

公开(公告)号：CN108986813A

公开(公告)日：2018-12-11

申请号：CN201811014878.5

申请日：2018-08-31

申请人： 出门问问信息科技有限公司

发明人： 胡亚光 , 周羊

IPC分类号： G10L15/22 , G10L15/26

摘要： 本发明实施例公开了一种唤醒词的更新方法、装置及电子设备。其中，方法包括：接收到第一语音信息时，确定针对第一语音信息的处理方式；若针对第一语音信息的处理方式为更新唤醒词时，从第一语音信息中确定目标发音序列；依据目标发音序列更新唤醒终端设备的原有唤醒词。本发明实施例解决了现有技术中唤醒词固定，用户无法自定义终端设备唤醒词的技术问题，保证了更新后的终端设备的唤醒词符合用户习惯，防止因唤醒词不符合用户习惯导致用户忘记唤醒词或无法准确说出唤醒词而导致的终端设备无法被唤醒的风险。

8.

发明公开
媒体访问的控制方法、装置及电子设备无效

公开(公告)号：CN108830059A

公开(公告)日：2018-11-16

申请号：CN201810502700.9

申请日：2018-05-23

申请人： 出门问问信息科技有限公司

发明人： 胡亚光 , 李志飞

IPC分类号： G06F21/32 , G06F17/30

摘要： 本发明实施例公开了一种媒体访问的控制方法、装置及电子设备，涉及终端应用技术领域，主要目的在于通过声纹特征识别的不同的年龄段，实现目标媒体内容的分级控制管理。本发明实施例的主要技术方案包括：获取语音搜索指令后，提取语音搜索指令中包含的第一声纹特征；所述语音搜索指令用于访问目标媒体内容，所述目标媒体内容拥有年龄访问标签；根据所述第一声纹特征判断对应的年龄；若所述第一声纹特征判断对应的年龄符合所述年龄访问标签，则响应所述语音搜索指令。

9.

发明公开
一种身份验证方法及装置无效

公开(公告)号：CN108712381A

公开(公告)日：2018-10-26

申请号：CN201810341816.9

申请日：2018-04-16

申请人： 出门问问信息科技有限公司

发明人： 李超 , 胡亚光 , 李深 , 孙理

IPC分类号： H04L29/06

CPC分类号： H04L63/08 , H04L63/0861 , H04L63/0876

摘要： 本发明公开了一种身份验证方法及装置，涉及数据处理技术领域，本发明的方法包括：当监测到待验证对象时，获取与所述待验证对象对应的多个特征参数；依次生成与所述各个特征参数分别对应的特征向量；根据所述特征向量计算与所述待验证对象对应的验证值；根据所述验证值确定所述待验证对象身份。实现了通过多模态对用户身份进行验证，提高了用户身份验证的准确性。

10.

发明公开
一种确定说话人特征的方法及装置有权

公开(公告)号：CN108899033A

公开(公告)日：2018-11-27

申请号：CN201810501729.5

申请日：2018-05-23

申请人： 出门问问信息科技有限公司

发明人： 胡亚光 , 李志飞

IPC分类号： G10L17/02 , G10L17/04 , G10L17/18 , G10L15/26

摘要： 本发明实施例公开了一种确定说话人特征的方法及装置，涉及数据处理技术领域，能够根据说话人提供的声音文本数据识别并确定说话人具有的特征信息，以便于开发人员依据得到的说话人特征能够更加有针对性地改进当前的智能化服务，以便于大大提高向说话人推送的个性化服务方案的应用价值。本发明实施例主要技术方案为：接收声音文本数据；从所述声音文本数据中提取声纹特征数据；利用预置模型对所述声纹特征数据进行处理，根据所述预置模型的输出数据，确定与所述声纹特征数据匹配的说话人特征。本发明实施例主要用于根据声音文本数据识别并确定说话人具有的特征信息。

搜索结果

国家/区域

专利有效性

申请日

公布(公告)日

申请人

申请人所在国/区域

发明人

IPC

IPC部

IPC大类

IPC小类

IPC大组

IPC小组

外观分类