-
公开(公告)号:CN108806699A
公开(公告)日:2018-11-13
申请号:CN201810542926.1
申请日:2018-05-30
申请人: OPPO广东移动通信有限公司
IPC分类号: G10L17/22 , G10L17/06 , G10L13/033
CPC分类号: G10L17/22 , G10L13/033 , G10L17/06
摘要: 本申请公开了一种语音反馈方法、装置、存储介质及电子设备。该方法包括:获取第一用户的语音数据;根据该第一用户的语音数据进行声纹模型训练,得到目标声纹模型;当需要对第二用户进行语音反馈时,检测该第一用户是否为该第二用户的关联用户;若是,则获取需要反馈的目标语音内容,并利用该目标声纹模型对该目标语音内容进行处理,按照该第一用户的音色输出该目标语音内容。本实施例以提高终端在与用户进行语音交互的过程中的灵活性。
-
公开(公告)号:CN108694949A
公开(公告)日:2018-10-23
申请号:CN201810257464.9
申请日:2018-03-27
申请人: 佛山市顺德区中山大学研究院 , 广东顺德中山大学卡内基梅隆大学国际联合研究院 , 中山大学
摘要: 本发明公开了基于重排序超向量和残差网络的说话人识别方法及其装置,方法包括:对语音样本进行信号检测,提取及优化MFCC特征;基于TDNN声学模型处理MFCC特征,得到均值中心化超向量;根据senone状态的相似性对均值中心化超向量进行重排序;以重排序后的均值中心化超向量作为外部神经网络的输入,对外部神经网络进行训练,其中输入端为残差网络,从其输出端获取说话人的深度编码特征;对说话人的深度编码特征进行PLDA建模,得到PLDA模型;计算语音样本的深度编码特征在PLDA模型上的似然得分,判断说话人是否为同一个人。本发明能够更好地学习超向量内部的连续性信息和局部相关性信息,有利于提升说话人识别性能。
-
公开(公告)号:CN108573708A
公开(公告)日:2018-09-25
申请号:CN201810192277.7
申请日:2018-03-08
申请人: 恩智浦有限公司
发明人: 阿德里安·丹尼尔
摘要: 根据本公开的第一方面,构想一种用于促进一个或多个时间序列样式的检测的方法,包括构建一个或多个人工神经网络,其中,对于待检测的至少一个时间序列样式,构建所述人工神经网络中的特定一个人工神经网络,所述人工神经网络中的所述特定一个人工神经网络被配置成产生决策输出和可靠性输出,其中所述可靠性输出指示所述决策输出的可靠性。根据本公开的第二方面,提供一种对应计算机程序。根据本公开的第三方面,提供一种用于促进一个或多个时间序列样式的检测的对应系统。
-
公开(公告)号:CN108510991A
公开(公告)日:2018-09-07
申请号:CN201810287474.7
申请日:2018-03-30
申请人: 厦门大学
摘要: 利用泛音列的说话人确认方法,涉及音频信号的说话人确认方法。提供步骤简便,效果优良且识别精度高的一种说话人确认方法。初设时,对任意选定单频率音频信号进行数字化,提取归一化泛音列并保存为频率与归一化幅度声音特征矩阵;确认时,输入待确认音频信号,经类似处理得到待比对声音特征矩阵,最后通过比对初设矩阵与待比对矩阵进行说话人确认。方法速度快,精度高,同时其原理性质可抵抗环境中大部分杂音干扰,有效确认说话人身份。在实际应用中,比如解锁、支付等需要确认身份的大多情况,则可以通过采用这种方法模型达到说话人确认的目的。实现了步骤简便且识别效果优良的一种说话人确认方法。
-
公开(公告)号:CN108320753A
公开(公告)日:2018-07-24
申请号:CN201810060221.6
申请日:2018-01-22
申请人: 珠海格力电器股份有限公司
IPC分类号: G10L17/06 , G10L17/22 , G10L15/22 , F24F11/526
CPC分类号: G10L15/22 , G10L17/06 , G10L17/22 , G10L2015/223
摘要: 本发明公开了一种电器设备的控制方法、装置和系统。其中,该方法包括:获取目标对象发出的第一语音信息;利用声纹识别模型对第一语音信息进行识别,确定与目标对象对应的声纹信息,其中,声纹识别模型为使用多组样本数据通过机器学习训练出来的,多组样本数据包括:目标对象的语音信息和相匹配的声纹信息;获取与声纹信息对应的控制方式;根据控制方式,对电器设备进行控制。本发明解决了现有的电器设备无法根据不同用户的控制习惯进行工作,个性化程度低的技术问题。
-
公开(公告)号:CN108304121A
公开(公告)日:2018-07-20
申请号:CN201810095008.9
申请日:2018-01-31
申请人: 上海与德科技有限公司
IPC分类号: G06F3/0484 , G10L15/22 , G10L17/06
摘要: 本发明实施方式涉及多媒体播放技术领域,公开了一种演示文稿的控制方法及装置。本发明实施方式中,演示文稿的控制方法包括:获取语音信息;判断语音信息中是否存在预设关键词;如果语音信息中存在预设关键词,则获取与预设关键词相对应的页面控制信息,并根据页面控制信息展示演示文稿。本发明实施方式还提供了一种演示文稿的控制装置。采用本发明的实施方式,用户能够通过语音控制演示文稿的展示,操作较为便捷。
-
公开(公告)号:CN107610708B
公开(公告)日:2018-06-19
申请号:CN201710434570.5
申请日:2017-06-09
申请人: 平安科技(深圳)有限公司
摘要: 本发明适用于互联网技术领域,提供了一种识别声纹的方法及设备,该方法包括:建立并训练通用识别模型,所述通用识别模型用于表示预设通信媒介下语音特征的分布;获取所述预设通信媒介下的语音数据;根据所述语音数据构建对应的所述声纹向量;根据所述通用识别模型确定所述声纹向量对应的所述声纹特征。本发明通过构建和训练通用识别模型对语音数据进行处理,得到对应的声纹向量,从而确定声纹特征,并根据声纹特征识别发出声音的人,由于通用识别模型不限制声音的内容,因此使本声纹识别的使用比较灵活,增多了声纹识别的使用场景。
-
公开(公告)号:CN108062354A
公开(公告)日:2018-05-22
申请号:CN201711176204.0
申请日:2017-11-22
申请人: 上海博泰悦臻电子设备制造有限公司
CPC分类号: G06F16/9535 , G10L15/22 , G10L17/06 , G10L2015/223
摘要: 本发明提供信息推荐方法、系统、存储介质、电子设备及车辆。方法包括:采集用户输入的语音信息,并从所述语音信息中提取声纹信息;将所述声纹信息与预存的对应于各用户账户的所有注册声纹信息进行匹配,以确定与所述声纹信息匹配的目标注册声纹信息;其中,各所述用户账户包括其用户的历史行为分析信息;登录与所述目标注册声纹信息对应的用户账户;检测该用户输入的语音命令,并结合所述历史行为分析信息向该用户推荐响应所述语音命令的信息。本发明通过识别声纹信息来鉴别用户身份,并按用户日常喜好为其推荐所需信息,有效提高了信息推荐的准确性、直观性。
-
公开(公告)号:CN108022600A
公开(公告)日:2018-05-11
申请号:CN201711016974.9
申请日:2017-10-26
申请人: 珠海格力电器股份有限公司
摘要: 本发明提供一种设备控制方法、装置、存储介质及服务器,所述方法包括:接收用户通过用户侧语音终端发送的设备选择信息;接收所述用户通过所述用户侧语音终端发送的第一声音信息;将所述设备选择信息与所述第一声音信息对应保存;接收所述用户通过用户侧语音终端或设备侧语音终端发送的第二声音信息;在预先保存的声音信息中查找是否存在与所述第二声音信息匹配的所述第一声音信息;若查找到与所述第二声音信息匹配的所述第一声音信息,则根据所述第一声音信息对应的设备选择信息,控制相应设备发出提示信息,以提示所述用户找到所述相应设备。根据本发明技术方案,用户可直接使用语音寻找自己选择的设备,以进行设备的使用。
-
公开(公告)号:CN107517207A
公开(公告)日:2017-12-26
申请号:CN201710715433.9
申请日:2017-08-20
申请人: 平安科技(深圳)有限公司
摘要: 本发明涉及一种服务器、身份验证方法及计算机可读存储介质,服务器包括存储器及与存储器连接的处理器,存储器中存储有可在处理器上运行的身份验证系统,身份验证系统被处理器执行时实现如下步骤:在收到身份验证请求后,随机向该客户端发送语音获取文本;接收客户端发送的用户播报的密码语音,识别出密码语音对应的密码字符;若密码字符与该语音获取文本对应的标准密码字符一致,则构建该密码语音的当前声纹特征向量,并根据预定的映射关系确定对应的标准声纹特征向量,利用预先确定的距离计算公式计算当前声纹特征向量与所确定的标准声纹特征向量之间的距离,根据距离对用户进行身份验证。本发明能够提高身份验证的安全性。
-
-
-
-
-
-
-
-
-