-
公开(公告)号:CN109697977A
公开(公告)日:2019-04-30
申请号:CN201810872293.0
申请日:2018-08-02
CPC分类号: G10L15/16 , G06N3/084 , G10L15/063 , G10L15/08 , G10L15/187 , G10L2015/085 , G10L2015/0631
摘要: 提供语音识别方法和设备。所述语音识别方法包括:获得划分成多个帧的声学序列;通过预测声学序列中的同一发音的持续时间并跳过针对与所述持续时间对应的帧的发音预测,确定声学序列中的发音。
-
公开(公告)号:CN107798052A
公开(公告)日:2018-03-13
申请号:CN201710761204.0
申请日:2017-08-30
申请人: 株式会社东芝 , 东芝数字解决方案株式会社
CPC分类号: G06F17/2735 , G06F17/2863 , G10L15/04 , G10L15/063 , G10L15/065 , G10L15/187 , G10L2015/0631 , G06F17/30737 , G06F3/16 , G10L15/265 , G10L15/30
摘要: 本发明提供能够有效地抑制将不应该登记的单词追加登记到单词词典中的不良情况的词典更新装置。该词典更新装置具备候补提取部、选择控制部及单词登记部。候补提取部基于通过声音识别引擎使用单词词典进行声音识别处理而获得的识别结果文本和表示修正了该识别结果文本的至少一部分的结果的修正结果文本,提取对所述单词词典追加登记的单词的候补。选择控制部生成选择画面,并受理对显示于该选择画面的候补进行选择的操作,该选择画面上以能够选择的方式显示提取到的候补,并且至少一并显示表示在将该候补追加登记到所述单词词典中的情况下对声音识别处理带来的影响的信息。单词登记部将在所述选择画面上所选择的候补追加登记到所述单词词典中。
-
公开(公告)号:CN107331388A
公开(公告)日:2017-11-07
申请号:CN201710453084.8
申请日:2017-06-15
申请人: 重庆柚瓣科技有限公司
IPC分类号: G10L15/06
CPC分类号: G10L15/063 , G10L2015/0631 , G10L2015/0638
摘要: 本发明涉及养老机器人技术领域,具体涉及一种基于养老机器人的方言收集系统,包括位于机器人本体内的数据处理模块,所述数据处理模块包括微控制器、语音收集单元、扬声器、匹配单元和存储单元,先由语音收集单元记录下老人诵读文章或词组词语的语音信息,语音收集单元将语音信息传递给微控制器,微控制器识别语音信息中的词汇并向匹配单元传递匹配信号,匹配单元对存储单元中的普通话词汇进行配对,配对成功后,匹配单元向微控制器传递播放信号,微控制器向扬声器传递启动信号,扬声器处播放出与方言对应的普通话。本发明让照顾老人的护工能够明白老人的话语,也能让与老人交流的让明白老人的意思,改善老人的社交情况,减少老人的孤独感。
-
公开(公告)号:CN106981287A
公开(公告)日:2017-07-25
申请号:CN201610024091.1
申请日:2016-01-14
申请人: 芋头科技(杭州)有限公司
发明人: 祝铭明
摘要: 本发明属于语音信号处理领域,尤其涉及一种提高声纹识别速度的方法及系统,应用于家用机器人,具体工作步骤包括:S1:采集语音信号;S2:对语音信号进行预处理;S3:自预处理后的语音信号中提取语音特征参数;S4:为每一个家庭成员建立声学模型;S5:预先根据使用频率将所述声学模型区分为第一声学模型和第二声学模型,其中,第一声学模型的使用频率大于第二声学模型,并在通电时将第一声学模型加载至缓存中;S6:依据所述第一声学模型和第二声学模型对待测语音信号进行模式匹配,获取识别结果。以上技术方案可以自适应地实现声纹识别,并有效提高了声纹识别的速度。
-
公开(公告)号:CN105895089A
公开(公告)日:2016-08-24
申请号:CN201511027242.0
申请日:2015-12-30
申请人: 乐视致新电子科技(天津)有限公司
IPC分类号: G10L15/14
CPC分类号: G10L15/10 , G10L15/063 , G10L15/142 , G10L15/183 , G10L25/39 , G10L2015/0631 , G10L15/14
摘要: 本发明涉及语音技术,公开了一种语音识别方法及装置。本发明中,预先根据通过模型训练得到的N个高斯进行软性聚类计算,得到M个软聚类高斯;在进行语音识别时,将语音转换得到特征向量,并根据该特征向量计算得分最高的前L个软聚类高斯,其中L小于M;将L个软聚类高斯内的各成员高斯,作为语音识别过程中声学模型里需要参与计算的高斯,进行声学模型似然度的计算。本发明提供的方法在语音识别的时候采用动态高斯选择的方式,减少识别过程中声学模型里需要评估的高斯个数,提高了声学模型似然度评估的速度和准确性。
-
公开(公告)号:CN103280216B
公开(公告)日:2016-07-13
申请号:CN201310181433.7
申请日:2011-01-28
申请人: 索尼电脑娱乐公司
发明人: X.梅宁德斯-皮达尔 , R.陈
IPC分类号: G10L15/14
CPC分类号: G10L15/144 , G10L15/187 , G10L2015/022 , G10L2015/0631
摘要: 本发明涉及改进依赖上下文的语音识别器对环境变化的鲁棒性。一种改进用于应用的依赖上下文的语音识别器对环境变化的鲁棒性的装置,其包括存储用于语音识别训练的声音的训练数据库,存储语音识别器所支持的单词的字典,以及利用训练数据库和字典对一个或多个多状态隐马尔可夫模型(HMM)的集合进行训练的语音识别器训练模块。所述语音识别器训练模块对每个HMM的每个状态执行非统一状态集群化过程,其中包括对每个HMM的至少一些状态使用不同的非统一集群阈值以更重度地集群化并相应减少在经验上受一种或多种上下文依赖性影响较小的每个HMM的状态中的那些状态的观察分布数目。
-
公开(公告)号:CN105609099A
公开(公告)日:2016-05-25
申请号:CN201510991556.6
申请日:2015-12-25
申请人: 重庆邮电大学
IPC分类号: G10L15/02 , G10L15/06 , G10L15/16 , G10L15/20 , G10L21/0232 , G10L21/0272
CPC分类号: G10L15/02 , G10L15/06 , G10L15/16 , G10L15/20 , G10L21/0232 , G10L21/0272 , G10L2015/0631
摘要: 本发明请求保护一种基于人耳听觉特性的语音识别预处理方法,涉及语音识别领域,它采用具有人耳听觉特性的预处理方法,具有较强的扩展性,在噪声环境下,相比于传统抗噪方法,该方法具有更好的抗噪效果,该语音识别系统具有更好的鲁棒性。含噪声的语音信号经过耳蜗基底膜模型进行频谱分析,再通过上橄榄核模型进行语音信息提取,最后在下丘脑细胞模型中完成语音分离。分离得到更纯净的语音后,通过语音定位确立目标语音信号,从而从噪声环境中分离出待识别语音信号。
-
公开(公告)号:CN100559464C
公开(公告)日:2009-11-11
申请号:CN200480007894.1
申请日:2004-03-03
申请人: 西门子公司
发明人: R·奥保尔
IPC分类号: G10L15/22
CPC分类号: G10L15/22 , G10L15/063 , G10L2015/0631
摘要: 在一种用于利用语音识别系统来依赖于说话人识别语音的方法中,其中训练用户的语音表达并且给所训练的语音表达分配指令,通过以下方式来解决节省时间地执行训练新指令(5)的任务,即在未识别出(3)语音表达时,通过语音识别系统建议用户直接将语音表达分配给新的指令(9)。
-
公开(公告)号:CN101535983A
公开(公告)日:2009-09-16
申请号:CN200780042315.0
申请日:2007-10-16
申请人: 沃伊斯博克斯科技公司
IPC分类号: G06F17/28
CPC分类号: G10L15/18 , G06F3/167 , G10L15/183 , G10L15/22 , G10L17/22 , G10L2015/0631
摘要: 提供了协作会话语音用户界面。协作会话语音用户界面可以基于短期和长期共享知识,以生成有关用户发声的意图的一个或多个显式的和/或隐式的假设。可以基于变化的确定程度,对假设进行分级,并可以为用户生成适应性响应。可以基于确定程度,用言辞来表达响应,并使随后发声的适当域成帧。在一种实现方式中,错误识别可以容忍,可以基于随后的发声和/或响应,纠正会话过程。
-
公开(公告)号:CN101454826A
公开(公告)日:2009-06-10
申请号:CN200780019786.X
申请日:2007-05-17
申请人: 日本电气株式会社
发明人: 三木清一
CPC分类号: G10L15/183 , G10L2015/0631
摘要: 提供语音识别词典/语言模型制作系统,其能够制作词典和语言模型,所述词典和语言模型在添加没有出现在学习文本中的词语时,通过根据要添加的词语选择按词语类别词语生成模型学习方法,能认出不在学习文本中出现的词语。语音识别词典/语言模型制作系统(100)包括:语言模型估计设备(111),其对于附加词语的每个词语类别从按词语类别学习方法知识存储区(109)中选择估计方法信息,所述附加词语是没有出现在学习文本(101)中的词语,并根据所选择的估计方法信息对于每个类别制作作为附加词语的词语生成模型的附加词语生成模型;数据库结合设备(112),其将附加词语添加到词典(105)、将附加词语生成模型添加到按词语类别词语生成模型数据库(107)中。
-
-
-
-
-
-
-
-
-