-
公开(公告)号:CN109147776A
公开(公告)日:2019-01-04
申请号:CN201710464202.5
申请日:2017-06-19
申请人: 丽宝大数据股份有限公司
CPC分类号: H04M1/271 , G06F1/3228 , G06F1/3265 , G06F3/167 , G06F21/32 , G09G2330/022 , G10L15/26 , H04M1/725 , H04W52/027 , G10L15/22 , G10L15/005 , G10L2015/223 , G10L2015/225
摘要: 本发明公开一种具有声控功能的显示装置及声控时机指示方法,声控时机指示方法包括:显示声控指示信息的视图;接收语音以产生一笔初始语音数据;于判断初始语音数据符合预设的触发语音数据时,再次接收语音以产生控制语音数据;于所产生的控制语音数据符合预设语音数据时,执行所对应的控制命令;及,停止显示声控指示信息的视图。本发明经由指示用户声控时机,可有效提升用户体验。
-
公开(公告)号:CN108962250A
公开(公告)日:2018-12-07
申请号:CN201811126305.1
申请日:2018-09-26
申请人: 出门问问信息科技有限公司
IPC分类号: G10L15/22
CPC分类号: G10L15/22 , G10L2015/223 , G10L2015/225
摘要: 本发明实施例涉及语音识别技术领域,特别是涉及一种语音识别方法、装置及电子设备,该语音识别方法,包括:基于用户输入的特定输入信息触发设备唤醒;基于用户输入的操作指令,确定所述操作指令的输入时间是否在所述设备处于唤醒状态的预设时间段内;若在所述设备处于唤醒状态的预设时间段内,基于用户输入的操作指令执行对应的操作处理。本发明实施例中,实现了在一定时间内基于一次唤醒的多个指令执行过程,降低了设备的处理消耗,简化了处理过程,并且提升了用户的使用体验。
-
公开(公告)号:CN108712610A
公开(公告)日:2018-10-26
申请号:CN201810482013.5
申请日:2018-05-18
申请人: 北京京东尚科信息技术有限公司 , 北京京东世纪贸易有限公司
CPC分类号: H04N5/232 , G10L15/22 , G10L2015/223 , G10L2015/225 , H04N5/23206 , H04N5/23222
摘要: 本申请实施例公开了智能照相机。该智能照相机的一具体实施方式包括:图像采集部件、语音采集部件和控制电路;图像采集部件被配置成实时获取视频流;语音采集部件被配置成实时获取周围环境中的语音信息;控制电路被配置成对语音采集部件获取到的语音信息进行分析,以获取用户指令,响应于获取到用户指令,确定获取到的用户指令的类别,若该类别是拍摄指令,则从图像采集部件获取视频流,对该视频流中的图像进行分析,确定图像所显示的目标物体的信息是否满足预设条件,若满足,则基于获取到的用户指令,控制图像采集部件进行拍摄。该实施方式实现了对智能照相机的语音控制,而且有助于提高智能照相机的拍摄效果。
-
公开(公告)号:CN108632776A
公开(公告)日:2018-10-09
申请号:CN201710170509.4
申请日:2017-03-21
申请人: 上海传英信息技术有限公司
发明人: 林兵
CPC分类号: G10L15/22 , G10L2015/225 , H04L12/1467 , H04M17/204 , H04W4/24
摘要: 本发明涉及一种手机充值方法及装置,属于电子通讯信息技术领域。本发明手机包括充值模块、充值逻辑模块、语音采集模块、语音识别模块,本发明方法包括以下步骤:所述充值模块启动所述语音采集模块;所述语音采集模块采集所述充值卡上的充值密码的语音信息;所述语音识别模块将所述语音信息转换成代码信息,并传入所述充值逻辑模块;所述充值逻辑模块将所述代码信息通过所述通讯网络发送至所述充值平台,并与所述充值平台交互,进行充值业务。本发明通过在手机中设置语音识别模块,把充值卡上的密码通过语音输入到手机上,可以直接识别充值卡上的充值密码,不用手动输入密码,从而简化输入充值码的过程,使用充值卡充话费变得更加便利。
-
公开(公告)号:CN108416041A
公开(公告)日:2018-08-17
申请号:CN201810210420.0
申请日:2018-03-14
申请人: 苏州思必驰信息科技有限公司
CPC分类号: G06F17/30191 , G06F17/30592 , G06F17/30976 , G10L15/22 , G10L15/30 , G10L2015/225
摘要: 本发明公开语音日志分析方法及装置,其中,方法包括:收集日志并存储在日志仓库;从日志仓库中提取对于用户音频信息的响应时间超过阈值的第一日志;将第一日志确定为异常日志,并将触发日志异常的用户音频信息标记为异常音频信息。本发明能够在互联网大数据背景下,依托大数据技术对语音日志进行分析和挖掘,从而可以从不同的维度对日志数据进行分析,以得到不同维度下的异常日志,从而尽可能地挖掘出潜在的问题。进一步地,后续可以对不同维度下的异常日志进行不同的处理,以达到对语音对话模型的优化,从而更好地应用于各种语音对话场景。
-
公开(公告)号:CN108090109A
公开(公告)日:2018-05-29
申请号:CN201710882194.6
申请日:2017-09-26
申请人: 谷歌有限责任公司
发明人: 维克拉姆·阿加尔瓦尔 , 林友仁 , 亚当·戈尔德施泰因
IPC分类号: G06F17/30
CPC分类号: G10L15/22 , G06F17/279 , G06F17/2881 , G10L15/30 , G10L2015/225
摘要: 本申请基于先前对话内容在自动化对话会话中提供提示。提供了与征求来自用户关于由自动化助理提供的建议或其它内容的一个或多个参数的反馈相关的方法、装置、和计算机可读介质。用户的反馈可以用于影响未来对话会话中由自动化助理随后提供给用户和/或其他用户的未来建议和/或其他内容。在一些实施方式中,在用户和自动化助理之间的对话会话中,自动化助理向用户提供内容——并且自动化助理提供在用户和自动化助理之间的未来对话会话中征求与提供的内容相关的用户反馈的提示。在这些实施方式中的一些中,在与来自先前的对话会话中提供的内容无关的未来对话会话中,在来自用户的输入和/或来自自动化助理的输出之后提供该提示。
-
公开(公告)号:CN107967913A
公开(公告)日:2018-04-27
申请号:CN201711224992.6
申请日:2017-11-29
申请人: 广西博点旅游产业发展有限公司
发明人: 黄丽萍
CPC分类号: G10L15/22 , G06F17/30864 , G06Q50/14 , G10L2015/225
摘要: 本发明提供一种旅游信息查询系统,包括信息查询终端、云服务器端及互联网;信息查询终端通过互联网与云服务器端连接;信息查询终端包括有PLC、显示器、终端信息获取模块、语音处理模块、终端查询模块、第一无线收发模块及位置定位单元,显示器、终端信息获取模块、语音处理模块、终端查询模块、第一无线收发模块及位置定位单元分别与PLC连接,位置定位单元用于定位用户所在地;云服务器端包括有控制器、云端信息获取模块、云端查询模块及第二无线收发模块;云端信息获取模块、云端查询模块及第二无线收发模块分别与控制器连接。该系统可查询旅游地的路线及路费明细,并且可接收语音查询,非常方便。
-
公开(公告)号:CN107919130A
公开(公告)日:2018-04-17
申请号:CN201711079226.5
申请日:2017-11-06
申请人: 百度在线网络技术(北京)有限公司
发明人: 钱胜
CPC分类号: G10L15/34 , G10L15/22 , G10L2015/225
摘要: 本发明提出一种基于云端的语音处理方法和装置,其中,方法包括:获取终端采集的待识别的语音;对待识别的语音进行语音识别;在语音识别的过程中,同时检测待识别的语音是否结束;当检测到待识别的语音结束时,将待识别的语音的识别结果反馈给终端。通过在语音的识别过程中,同时检测待识别的语音是否结束,从而可以保证语音识别的准确性。进一步地,由云端进行语音识别,与终端本地无关,因此和硬件平台无关,不存在迁移开发,且不受终端本地资源的限制,因此,云端使用的语音识别模型可以做的非常复杂精细,从而可以提升系统的抗干扰性能。此外,云端使用的语音识别模型,已经为不同的应用量身打造,无需重新训练模型,简化了开发量。
-
公开(公告)号:CN107919126A
公开(公告)日:2018-04-17
申请号:CN201711194068.8
申请日:2017-11-24
申请人: 合肥博焱智能科技有限公司
CPC分类号: G10L15/26 , G06F17/2785 , G10L15/05 , G10L2015/225
摘要: 本发明公开了一种智能语音交互系统。涉及语音交互技术领域。包括声音采集模块、PFGA预处理模块、智能交互中心;PFGA预处理模块包括端点检测单元;端点检测单元分别与声音预处理单元、特征提取单元电性连接;智能交互中心包括控制单元;控制单元分别与存储单元、语音识别模块、语义理解模块、交互处理模块、语音合成模块、反馈模块、扬声器电性连接;声学模型库包括HMM模型数据库和ANN模型数据库;语言模型库包括N-Gram模型数据库和Rule-based模型数据库。本发明利用反馈模块对识别信息的反馈,并通过控制单元向客户展示识别信息,同时控制改变声音匹配模型和语言模型库,提高交互系统的交互识别正确率。
-
公开(公告)号:CN107910002A
公开(公告)日:2018-04-13
申请号:CN201711385318.6
申请日:2017-12-20
申请人: 北京工业大学
IPC分类号: G10L15/22 , G10K11/178
CPC分类号: G10L15/22 , G10K11/178 , G10L2015/223 , G10L2015/225
摘要: 本发明公开了一种人机语音图形交互系统及方法,该系统包括声音采集模块、语音处理模块以及动态表情反馈模块;声音采集模块,用于获取用户输入的音频信号;语音处理模块,与声音采集模块连接,用于对获取的音频信号进行滤波、降噪、转换处理,输出有效文字信号;动态表情反馈模块,与语音处理模块连接,用于接收有效文字信号,并根据有效文字信号反馈相应的动态图形。因此,采用本发明提供系统或方法,能够在嘈杂环境或者用户语音命令表达略模糊时做出准确的音频信息提取与辨别,输出有效文字信号,并根据有效文字信号以图形形式反馈与用户,避免呈现形式单一,提高用户的互动体验感。
-
-
-
-
-
-
-
-
-