-
公开(公告)号:CN105869624A
公开(公告)日:2016-08-17
申请号:CN201610188168.9
申请日:2016-03-29
申请人: 腾讯科技(深圳)有限公司
CPC分类号: G10L15/063 , G10L15/02 , G10L15/04 , G10L15/142 , G10L15/144 , G10L15/187 , G10L25/24 , G10L25/90 , G10L2015/025 , G10L2015/0631
摘要: 本发明公开了一种数字语音识别中语音解码网络的构建方法及装置,所述方法包括:获取进行数字语音录制所得到的训练数据,所述训练数据包括若干语音段;进行所述训练数据中的声学特征提取,得到每一语音段对应的特征序列;根据所述特征序列和训练数据中数字对应的音素,进行以单音素声学模型为起始的渐进训练得到声学模型;获取语言模型,通过所述语言模型和训练得到的声学模型构建语音解码网络,所述语言模型是通过对所述训练数据中数字的匹配关系建模得到的。本发明的数字语音识别中语音解码网络的构建方法及装置能够有效地提高数字语音的识别准确率。
-
公开(公告)号:CN105788597A
公开(公告)日:2016-07-20
申请号:CN201610313019.0
申请日:2016-05-12
申请人: 深圳市联谛信息无障碍有限责任公司
CPC分类号: G10L15/02 , G06F3/167 , G10L15/22 , G10L15/26 , G10L2015/223 , G10L2015/225 , H04M1/72522 , H04M1/72563 , H04M1/72594
摘要: 本发明实施例公开了一种基于声音识别的读屏应用指令输入方法,包括:获取麦克风采集的音频数据;获取与所述音频数据对应的特征数据;在预设的动作/手势数据库中查找与所述特征数据匹配的目标动作/手势;确定与所述目标动作/手势对应的读屏功能操作,执行所述读屏功能操作。另外,本发明实施例还公开了一种基于声音识别的读屏应用指令输入装置。采用本发明,可提高读屏应用的指令输入的操作便利性。
-
公开(公告)号:CN105719664A
公开(公告)日:2016-06-29
申请号:CN201610024270.5
申请日:2016-01-14
申请人: 盐城工学院
CPC分类号: G10L25/63 , G10L15/01 , G10L15/02 , G10L15/1807 , G10L25/27
摘要: 本发明公开了一种基于似然概率模糊熵的紧张状态下语音情绪自动识别方法,能够自动识别语音中的紧张情绪,通过诱发的方法来采集紧张情绪的语料,使数据更加接近真实的情感数据,从而获得较好的紧张情绪的识别性能;另外,本发明采用可拒判的语音情感识别方法,对于不确定的或未知的情感样本,分类器给出拒绝判断的识别结果,即不属于需要检测的实用语音情感类别中的任何一类,能够保证识别的准确性,有效的降低误判率。
-
公开(公告)号:CN105609098A
公开(公告)日:2016-05-25
申请号:CN201510949192.5
申请日:2015-12-18
申请人: 江苏易乐网络科技有限公司
发明人: 冯军
CPC分类号: G10L15/01 , G09B5/04 , G09B7/02 , G10L15/02 , G10L15/16 , G10L15/22 , G10L15/25 , G10L15/30 , G10L2015/025
摘要: 一种基于互联网的在线学习系统,包括多个具有显示界面的终端,其特征在于:终端包括,用户注册模块,上传模块,下载模块,表情识别模块,语音采集和识别模块,存储模块,评分模块,课程同步模块。本发明具有的有益效果:能够根据学习者的面部表情判断其是否处于学习状态以达到监控的目的,此外还能根据学习者的口型变化结合语音识别判断其发音是否准确,实现及时纠正和指导。还能够将学习者的错误反馈给学习者以便其改正。还能够根据不同终端进行同步学习。
-
公开(公告)号:CN105529035A
公开(公告)日:2016-04-27
申请号:CN201510916425.1
申请日:2015-12-10
申请人: 安徽海聚信息科技有限责任公司
CPC分类号: G10L21/10 , A61B5/01 , G10L15/02 , G10L15/26 , G10L2021/065
摘要: 本发明公开了一种用于智能穿戴设备的系统,包括采集单元、分析单元、控制单元、提醒单元。采集单元、分析单元、提醒单元均与控制单元连接,并通过无线信号进行通信。采集单元与分析单元之间通过滤波模块和模数转换模块连接。采集单元所采集的信息送至滤波模块进行滤波处理,经过滤波处理后的数据被送入模数转换模块,将连续的模拟信号转换为数字信号后送至分析单元进行分析处理。本发明与现有技术相比,具有结构合理、操作简便,能够完成对外部语音信号的拾取,并实现语音、文字互相转换,进而有效解决听力残缺人士日常交际障碍等显著的优点,方便了听力残疾人士的日常生活,还照顾到他们的体温健康,便于大范围推广使用。
-
公开(公告)号:CN105469783A
公开(公告)日:2016-04-06
申请号:CN201510772801.4
申请日:2015-11-12
申请人: 深圳TCL数字技术有限公司
发明人: 王云华
IPC分类号: G10L15/02 , G10L15/26 , G10L15/34 , H04N21/4415 , H04N21/462
CPC分类号: G10L15/02 , G10L15/26 , G10L15/34 , H04N21/4415 , H04N21/462
摘要: 本发明公开了一种音频识别方法,所述音频识别方法包括以下步骤:获取音频缓存区中存储的音频数据,其中,终端在接收到音频数据时,将接收到的音频数据存储至所述音频缓存区中;获取所述音频数据的第一特征信息以及终端当前显示界面中各个字符的第二特征信息;确定当前显示界面的各个字符中所述第二特征信息与所述第一特征信息匹配的字符;将获取的所述字符作为与所述音频数据匹配的字符。本发明还公开了一种音频识别装置。本发明实现通过智能电视解决了语音传送过程中,出现PCM码流数据的丢失的问题,提高了语音识别准确度。
-
公开(公告)号:CN105448291A
公开(公告)日:2016-03-30
申请号:CN201510873749.1
申请日:2015-12-02
申请人: 南京邮电大学
CPC分类号: G10L15/02 , G06F19/34 , G10L15/063 , G10L17/04
摘要: 本发明公开了基于语音的帕金森症检测方法,属于信号处理和机器学习技术领域,从采集到的被检测者的语音中提取与帕金森症相关的特征,按提取的先后顺序将全部特征记录到一个向量中并使用SVM分类器对该向量进行分类,分类结果即是检测结果。基于语音检测帕金森症的检测系统,包括语音采集装置;语音信号处理系统,从语音中提取与帕金森症相关的特征;SVM分类系统,将专业机构收集的帕金森数据集训练SVM分类器,使用该分类器对被检测者语音特征进行分类,判断被检测者是否患有帕金森症。本发明的处理过程由计算机软件分析完成,解决了临床观察帕金森周期长,成本高等问题,具有实时、高效、低成本、极端环境操作简单可靠等特点。
-
公开(公告)号:CN105355195A
公开(公告)日:2016-02-24
申请号:CN201510623617.3
申请日:2015-09-25
申请人: 小米科技有限责任公司
IPC分类号: G10L15/02
CPC分类号: G10L15/02
摘要: 本公开是关于音频识别方法及装置。该方法包括:采集校准语音;获取所述校准语音的语音特征信息;采集待识别语音;在采集的待识别语音中检测与所述语音特征信息匹配的指令语音;响应于检测到所述指令语音,执行所述指令语音对应的操作。该技术方案通过将采集的语音作为校准语音,并从待识别的语音中检测与校准语音匹配的指令语音,如果检测到指令语音,则执行指令语音对应的操作,因此,用户可以预先采集自己的语音作为校准语音,这样即使用户输入的语音并非标准的普通话,也能很容易的进行识别,给用户带来了便利,提升了用户的使用体验。
-
公开(公告)号:CN104992095A
公开(公告)日:2015-10-21
申请号:CN201510367441.X
申请日:2015-06-29
申请人: 百度在线网络技术(北京)有限公司
发明人: 宋辉
CPC分类号: G06F21/32 , G06F2221/2133 , G10L15/02
摘要: 本发明提出一种信息验证方法和系统,该信息验证方法包括获取待识别的音频片断;对所述待识别的音频片断进行特征提取,获取所述待识别的音频片断对应的特征数据;根据所述特征数据和预先生成的数据模型,获取验证结果。该方法能够提高信息验证的安全性和使用便捷性。
-
公开(公告)号:CN103491257B
公开(公告)日:2015-09-23
申请号:CN201310453293.4
申请日:2013-09-29
申请人: 惠州TCL移动通信有限公司
IPC分类号: H04M1/725 , H04M1/2745 , H04W4/14
CPC分类号: H04W8/183 , G10L15/02 , G10L15/22 , G10L17/22 , G10L2015/223 , H04M1/274516 , H04M3/42059 , H04M3/42204 , H04M2201/40 , H04M2203/357 , H04M2203/654 , H04M2250/74 , H04W4/12 , H04W4/14
摘要: 本发明公开一种在通话过程中发送联系人信息的方法及系统,其中,包括步骤:在移动终端通话过程中,提取用户的语音数据,并对语音数据进行识别;判断是否为语音控制指令;当是语音控制指令时,将语音控制指令转换为相应的统一码;根据统一码搜索用户需要发送的联系人信息,并将搜索到的联系人信息发送至对方。本发明在信息发送过程中不会影响用户的通话,也无需用户手动操作,所以使用起来非常方便,操作非常方便。
-
-
-
-
-
-
-
-
-