-
公开(公告)号:CN109473106A
公开(公告)日:2019-03-15
申请号:CN201811339705.0
申请日:2018-11-12
申请人: 平安科技(深圳)有限公司
发明人: 朱文和
CPC分类号: G10L17/005 , G10L15/26 , G10L17/04 , G10L25/63
摘要: 本发明公开了一种声纹样本采集方法、装置、计算机设备及存储介质。所述方法包括:获取声纹采集请求中包含的台词情绪标签;从预设的台词数据库中选取台词情绪标签对应的台词文本,并将台词文本发送到客户端;接收客户端返回的采集用户朗读台词文本的语音数据;对语音数据进行有效性校验,若有效性校验通过,则将语音数据转换为语音文本;对语音文本和台词文本进行文本相似度匹配;若匹配结果为匹配成功,则提取所述语音数据的声纹特征,将声纹特征、台词情绪标签和台词文本作为声纹样本,并关联保存到声纹情绪识别模型对应的样本库中。本发明的技术方案通过台词情绪标签有针对性的采集声纹情绪识别模型的声纹样本,降低采集成本,提高采集效率。
-
公开(公告)号:CN109473105A
公开(公告)日:2019-03-15
申请号:CN201811261457.2
申请日:2018-10-26
申请人: 平安科技(深圳)有限公司
CPC分类号: G10L17/005 , G10L17/04 , G10L25/24 , G10L25/30 , G10L25/51
摘要: 本申请揭示了一种与文本无关的声纹验证方法、装置和计算机设备,其中方法包括:截取待验证的语音中低于指定频率的第一语音,并利用梅尔倒谱系数提取所述第一语音的频谱特征;通过预设的基于深度神经网络训练的声纹特征提取模型提取所述频谱特征的第一声纹特征;在预设的声纹数据库中查找与所述第一声纹特征匹配的第二声纹特征;若查找到与所述第一声纹特征匹配的第二声纹特征,则判定所述待验证的语音验证通过。本申请利用基于深度神经网络训练的声纹特征提取模型来提取待验证语音的声纹特征,具有更快的提取效率,节约系统的内存和显存等,上述声纹特征提取模型可以不间断的自我学习,其提取声纹特征的准确性会保持一定的准确性。
-
公开(公告)号:CN109150556A
公开(公告)日:2019-01-04
申请号:CN201810858206.6
申请日:2018-07-31
申请人: 何镝
IPC分类号: H04L12/18 , H04L29/06 , G10L17/00 , G10L17/04 , G10L21/0208
CPC分类号: H04L12/1831 , G10L17/005 , G10L17/04 , G10L21/0208 , H04L65/403
摘要: 本发明公开一种基于语音识别的多人远程会议记录系统,本系统应用到的技术包括远程视频会议系统以及语音识别技术。包括至少两台机器人系统,至少两台机器人系统通过互联网建立通信连接;所述机器人系统包括:均与电源模块连接的语音处理模块和中央处理器;还包括均与中央处理器连接的摄像头、触摸式显示器、扬声器、第一WIFI模块;还包括与语音处理模块连接的麦克风阵列、第二WIFI模块;还包括与第二WIFI模块连接的存储模块、语音识别服务器;还包括与语音识别服务器连接的角色定义模块、内容识别模块;还包括与角色定义模块和内容识别模块连接的文档生成模块。
-
公开(公告)号:CN108962217A
公开(公告)日:2018-12-07
申请号:CN201810857240.1
申请日:2018-07-28
申请人: 华为技术有限公司
CPC分类号: G10L13/02 , G10L17/005 , G10L17/04 , G10L17/22
摘要: 本申请提供了语音合成方法及相关设备,该方法包括:根据用户的当前输入语音确定用户身份;根据所述当前输入语音从声学模型库中获得声学模型;根据用户身份确定基础语音合成信息,基础语音合成信息表征声学模型的预设音速、预设音量、预设音高中的变化量;确定回复文本;根据回复文本、上下文信息确定强化语音合成信息,强化语音合成信息表征声学模型的预设音色、语调和预设韵律节奏中的变化量;通过所述声学模型,根据基础语音合成信息和所述强化语音合成信息对所述回复文本进行语音合成,得到回复用户的语音。实施本申请的方案,能够让设备在人机交互过程中为用户提供个性化的语音合成效果,提升用户的语音交互体验。
-
公开(公告)号:CN108702409A
公开(公告)日:2018-10-23
申请号:CN201680082055.9
申请日:2016-12-16
申请人: 快速求救公司
IPC分类号: H04M1/725
CPC分类号: H04W4/90 , G10L15/22 , G10L17/005 , G10L2015/223 , H04M1/236 , H04M1/271 , H04M2242/04 , H04M2250/10 , H04M2250/12 , H04M2250/22 , H04M2250/52 , H04M2250/68 , H04M2250/74 , H04W4/02 , H04W12/06 , H04W64/00 , H04W76/50 , H04W88/02
摘要: 公开了用于使用数字设备进行有效紧急呼叫的设备、系统、方法和介质。在一些实施方式中,用户能够通过一触式或两触式过程进行紧急呼叫。认证过程可以减少无意和未经授权的紧急呼叫。还公开了可用于在设备的不同状态中用于紧急呼叫的持久紧急按钮。
-
公开(公告)号:CN108428134A
公开(公告)日:2018-08-21
申请号:CN201710489753.7
申请日:2017-06-24
申请人: 平安科技(深圳)有限公司
发明人: 晏湘涛
CPC分类号: G06Q20/40145 , G06Q20/409 , G06Q20/42 , G06Q40/08 , G10L17/005 , H04M3/493
摘要: 本发明公开一种电子装置、IVR语音支付方法及计算机可读存储介质,其中,该方法包括:在接收到进线客户的语音支付请求后,获取当前进线号码对应的客户身份信息;成功获取客户身份信息后,获取该客户身份信息对应的已授权银行卡信息;成功获取已授权银行卡信息后,播报提示客户说出已授权银行卡的卡号信息;接收客户说出卡号信息的语音数据,提取其中的声纹特征,并确定当前客户身份信息对应的客户声纹特征数据,将两者匹配;在匹配成功后,提取接收到的语音数据中的卡号信息,并将该卡号信息与已授权银行卡信息比对;在比对成功后,对获取到的已授权银行卡进行扣款操作。本发明技术方案提升了IVR语音支付的适用场景和安全性。
-
公开(公告)号:CN108288471A
公开(公告)日:2018-07-17
申请号:CN201711466945.2
申请日:2017-12-28
申请人: 三星电子株式会社
CPC分类号: G10L15/22 , G06F1/163 , G10L17/02 , G10L17/04 , G10L17/16 , G10L17/18 , G10L17/22 , G10L21/0208 , G10L21/0272 , G10L17/005
摘要: 一种电子设备包括:获得音频信号的麦克风;存储讲话者模型的存储器;以及至少一个处理器。所述至少一个处理器被配置为从所述音频信号获得语音信号,将所述语音信号与所述讲话者模型进行比较以验证用户,以及如果验证结果指示所述用户对应于预先登记的讲话者,执行与所获得的语音信号相对应的操作。
-
公开(公告)号:CN107918726A
公开(公告)日:2018-04-17
申请号:CN201710981331.1
申请日:2017-10-18
申请人: 深圳市汉普电子技术开发有限公司
CPC分类号: G06F21/32 , G06K9/00268 , G10L17/005 , G10L25/48 , G10L25/51
摘要: 本发明公开了一种距离感应方法、设备及存储介质,本发明通过距离感应设备获取当前用户的人脸图像信息,根据所述人脸图像信息计算与所述当前用户之间的第一参考距离,获取当前环境中的声音音频信息,根据所述声音音频信息计算与所述当前用户之间的第二参考距离,根据所述第一参考距离与所述第二参考距离确定目标距离,将所述目标距离与预设距离进行比对,当所述目标距离小于所述预设距离时,启动人机对话功能,能够通过人脸识别和声波感应获得的距离与预设距离比较,从而让设备做出不同响应,不用依赖特定关键词进行设备唤醒,缩短了设备响应的时间,让设备更加智能化和人性化,提升了用户体验。
-
公开(公告)号:CN107909997A
公开(公告)日:2018-04-13
申请号:CN201710911313.6
申请日:2017-09-29
申请人: 威创集团股份有限公司
CPC分类号: G10L15/22 , G06F3/1446 , G10L15/26 , G10L17/005 , G10L17/20 , G10L2015/223
摘要: 本发明涉及显示拼接墙技术领域,尤其涉及一种拼接墙控制方法以及一种拼接墙控制系统。一种拼接墙控制方法,包括以下步骤:接收操作者输入的语音信息;提取所述语音信息中的声纹信息;根据所述声纹信息确定所述操作者的控制权限;将具有控制权限的语音信息转化为控制指令;根据控制指令控制所述拼接墙。设置控制权限以后,拼接墙避免被频繁地操作甚至被误操作,拼接墙的使用安全得到了保障,拼接墙所调取的信息能够及时正确的显示,特别是在紧急场合,增加控制权限的方法能加快现场信号调度的速率。
-
公开(公告)号:CN107704569A
公开(公告)日:2018-02-16
申请号:CN201710912342.4
申请日:2017-09-29
申请人: 努比亚技术有限公司
发明人: 李岩
CPC分类号: G06F17/30681 , G06F17/30684 , G10L17/005 , G10L25/51
摘要: 本发明实施例公开了一种语音查询方法、终端及计算机可读存储介质,所述语音查询方法包括:当语音查询功能开启时,获取语音查询指令,并提取语音查询指令对应的声纹特征和查询关键词;根据预存查询类型库、声纹特征以及查询关键词,判断是否存在优先查询类型;若存在优先查询类型,则从预存查询类型库中获取优先查询类型;响应语音查询指令,根据优先查询类型和查询关键词进行查询,获得查询结果。本发明实施例提供的语音查询方法,能够在进行信息查询的实现过程中,针对不同的用户提供个性化的查询结果,从而提高终端的智能性。
-
-
-
-
-
-
-
-
-