-
公开(公告)号:CN117014668A
公开(公告)日:2023-11-07
申请号:CN202310791851.1
申请日:2023-06-29
申请人: 海信视像科技股份有限公司
发明人: 杨香斌
IPC分类号: H04N21/422 , G06F3/16 , G10L15/22 , H04N21/431 , H04N21/485 , H04N21/443 , G10L17/22 , G10L17/24
摘要: 本申请提供一种显示设备及显示设备的唤醒方法。显示设备处于亮屏状态,且处于第一状态时,采集用户语音。在识别到用户语音包含唤醒词时,显示设备被唤醒。显示设备根据第一状态显示弹窗,或者播放唤醒提示音。显示设备处于亮屏状态时,如果在第一状态下被唤醒,可以通过显示弹窗或者播放唤醒提示音的方式提示用户被唤醒,且未发出声音的原因是当前处于静音模式,提高用户的体验感。
-
公开(公告)号:CN117012206A
公开(公告)日:2023-11-07
申请号:CN202311276830.2
申请日:2023-10-07
申请人: 山东省智能机器人应用技术研究院 , 山东灵智机器人自动化有限公司
摘要: 本发明涉及一种人机语音交互系统,尤其涉及语音交互技术领域,包括,语音获取模块,用以获取语音信息;语音分析模块,用以判断语音交互方式;第一控制模块,用以获取交互图像;语音识别模块,用以对语音信息进行分析,还用以对识别文字进行关键词分析;交互分析模块,用以对唤醒方式进行分析;调整优化模块,用以对唤醒方式的分析过程进行调整和优化;第二控制模块,用以对语音助手进行控制;反馈校正模块,用以获取语音助手唤醒后用户的交互情况,并对唤醒方式的优化过程进行校正。本发明实现了对人机语音交互环境的分析以唤醒语音助手,解决了人机语音交互分析效率低,语音助手唤醒不准确的问题。
-
公开(公告)号:CN113782021B
公开(公告)日:2023-10-24
申请号:CN202111073544.7
申请日:2021-09-14
申请人: VIDAA(荷兰)国际控股有限公司
IPC分类号: G10L15/22 , G10L17/22 , G10L17/24 , H04N21/4415 , G06F3/16
摘要: 本申请提供一种显示设备及提示音的播放方法,可以在用户发出唤醒指令时,通过主进程尽快响应唤醒指令,以播放与语音资源的资源状态相对应的提示音,提示用户远场语音功能当前所处的工作状态,以及明确指示用户发送语音指令等,避免出现由于远程语音进程中语音资源未完成加载,无法给出用户任何响应和指示,导致用户盲目等待的问题,以提高用户的远场语音功能的体验感。
-
公开(公告)号:CN115880744B
公开(公告)日:2023-10-20
申请号:CN202210916392.0
申请日:2022-08-01
申请人: 北京中关村科金技术有限公司
摘要: 本发明公开了一种基于唇动的视频角色识别方法、装置及存储介质,可以对与目标视频文件关联的随路数据进行角色面部识别,获取每个角色对应的面部标准图像和第一面部区域信息,并建立角色信息、面部标准图像和第一面部区域信息的关联关系;对所述目标视频文件进行唇动识别,确定发生唇动的面部识别图像和第二面部区域信息;基于随路数据中的识别标识确定识别策略;基于每个角色对应的面部标准图像和第一面部区域信息、所述面部识别图像、所述第二面部区域信息和识别策略进行角色识别,确定角色识别结果。本发明基于发生唇动的面部图像和面部区域信息基于不同的策略进行角色信息的识别,实现满足不同性能要求,不同准确度要求的角色识别。
-
公开(公告)号:CN116844556A
公开(公告)日:2023-10-03
申请号:CN202210307379.5
申请日:2022-03-25
申请人: 大众问问(北京)信息科技有限公司
摘要: 本申请涉及一种语音性别识别方法、装置、计算机设备和存储介质。该方法包括:获取待识别语音数据,从待识别语音数据中提取得到目标语音特征;将目标语音特征输入至目标说话者分类模型,通过目标说话者分类模型对目标语音特征进行预测,得到第一说话者特征向量;将目标语音特征输入至高斯混合模型,通过高斯混合模型对目标语音特征进行计算,得到第二说话者特征向量;根据第一说话者特征向量和第二说话者特征向量拼接得到目标说话者特征向量;将目标说话者特征向量输入至目标语音性别分类模型,通过目标语音性别分类模型对目标说话者特征向量进行分类,得到目标语音性别识别结果。采用本方法能够提高语音性别识别准确率。
-
公开(公告)号:CN116822529A
公开(公告)日:2023-09-29
申请号:CN202311092677.8
申请日:2023-08-29
申请人: 国网信息通信产业集团有限公司 , 福建亿榕信息技术有限公司
IPC分类号: G06F40/30 , G06F9/4401 , G10L15/22 , G10L17/22
摘要: 本发明公开了基于语义泛化的知识要素抽取方法,涉及数据处理技术领域;所述方法包括以下步骤:通过采集语音数据的多项数据信息,将设备运行信息以及通信转换信息进行处理生成泛化评估系数,根据生成的泛化评估系数与设置的泛化评估阈值进行对比,对接收语音的质量进行评估,从而确定了需要进行泛化处理的语音数据,再根据数据精度信息与处理时长信息进行分析,生成抽取影响因子,对知识要素的抽取情况进行分析,根据抽取影响因子与抽取评估阈值的对比结果评估两次知识要素的抽取情况,根据抽取情况的不同进行相应操作,从而增加了智能家居调控的准确性,保障了智能家居运行的高效性。
-
公开(公告)号:CN111292743B
公开(公告)日:2023-09-26
申请号:CN202010074175.2
申请日:2020-01-22
申请人: 北京小米松果电子有限公司
摘要: 本公开是关于一种语音交互方法及装置、电子设备。语音交互方法应用于终端设备,所述方法包括:接收用户语音信息;通过姿态决策模型确定与所述用户语音信息对应的预测信息,所述预测信息用于确定与用户进行交互的三维虚拟人物的姿态;通过所述终端设备的显示装置呈现三维虚拟人物的姿态。
-
公开(公告)号:CN116563984B
公开(公告)日:2023-09-22
申请号:CN202310833552.X
申请日:2023-07-10
申请人: 深圳市旭子科技有限公司
摘要: 本发明涉及物联网的技术领域,公开了一种基于物联网的开锁方法及系统;本发明采用手指上部分区域的指纹进行解锁,即只需验证手指指纹的部分指纹即可通过解锁验证,与传统的全指纹验证相比,部分指纹验证具有更便捷更高效的优势,不会出现传统的全指纹验证中手指放置不正导致未能完成验证的现象,提升了解锁的效率,解决了现有技术中仅通过声纹或指纹进行解锁验证安全性不足的问题。
-
公开(公告)号:CN116758924A
公开(公告)日:2023-09-15
申请号:CN202310667294.2
申请日:2023-06-06
申请人: 广东好太太科技集团股份有限公司
摘要: 本申请提供一种晾衣机的语音播报控制方法、装置、存储介质和设备,所述晾衣机的语音播报控制方法包括:获取语音播报功能开启指令,开启语音播报功能;获取语音播报数据;所述语音播报数据包括语音播报参数和语音播报条件;当满足所述语音播报条件时,根据所述语音播报参数使晾衣机执行语音播报功能。本申请基于用户设置的语音播报条件,根据用户设置的语音播报参数启动晾衣机的语音播报功能,提高用户操作晾衣机时的互动体验感,并且通过语音播报功能,方便用户更容易地熟悉晾衣机的操作。
-
公开(公告)号:CN116741184A
公开(公告)日:2023-09-12
申请号:CN202310960642.5
申请日:2023-08-01
申请人: 成都锦城学院
摘要: 本发明公开了一种基于孪生网络的声纹识别方法,属于声纹识别领域,该方法包括获取由若干组语音训练样本对组成的初始数据;根据初始数据,利用孪生神经网络,得到声纹识别模型;获取待验证语音和语音数据库;根据待验证语音和语音数据库,利用声纹识别模型,得到声纹识别结果。本发明解决了声纹识别过程语音信息各维度相关性低的问题,且小量数据集也能达到较好的效果,提高了声纹识别准确率。
-
-
-
-
-
-
-
-
-