-
公开(公告)号:CN102262644A
公开(公告)日:2011-11-30
申请号:CN201110135123.2
申请日:2011-05-18
Applicant: 索尼公司
CPC classification number: G06F17/30743 , G10L17/26
Abstract: 本发明涉及搜索装置、搜索方法以及程序。搜索装置包括:声音识别单元,其识别输入声音;用户信息估计单元,其基于输入声音估计输入声音的说话者的身体状态和情感行为中的至少一个,并且输出表示估计结果的用户信息;匹配单元,其对于多个搜索结果目标词语串中的每个,在搜索结果目标发音符号串和识别结果发音符号串之间执行匹配;以及生成单元,其基于匹配结果,从多个搜索结果目标词语串中生成搜索结果词语串,作为与输入声音对应的词语串的搜索结果。匹配单元和生成单元中的至少一个根据用户信息来改变处理。
-
公开(公告)号:CN102667773B
公开(公告)日:2015-02-04
申请号:CN201080053823.0
申请日:2010-12-02
Applicant: 索尼公司
IPC: G06F17/30 , G10L15/187
CPC classification number: G06F17/30681 , G10L15/08 , G10L15/187 , G10L15/22 , G10L2015/025
Abstract: 公开了一种搜索设备、搜索方法和程序,采用该搜索设备、搜索方法和程序,能够鲁棒地搜索对应于输入语音的词串。公开的搜索设备包括:语音识别单元(11),用于对输入语音进行语音识别;匹配单元(16),用于关于多个搜索结果词串中的每个执行搜索结果发音符号串与识别结果发音符号串的匹配,其中,多个搜索结果词串是要成为对应于输入语音的词串的搜索结果的词串,搜索结果发音符号串是表示词串搜索结果的发音的发音符号排列,而识别结果发音符号串是表示输入语音的语音识别结果的发音的发音符号排列;以及输出单元(17),用于基于搜索结果发音符号串与识别结果发音符号串的匹配结果输出搜索结果词串,其中搜索结果词串是从多个搜索结果词串中搜索对应于输入语音的词串而得到的结果。公开的搜索设备例如可以应用于语音搜索。
-
公开(公告)号:CN102074230B
公开(公告)日:2012-09-05
申请号:CN201010540142.9
申请日:2010-11-11
Applicant: 索尼公司
CPC classification number: G10L15/20 , G10L21/0272 , G10L2021/02166
Abstract: 本发明涉及语音识别装置、语音识别方法和程序。该语音识别装置包括:声源分离单元,被配置为把多个声源的输出的混合信号分离成与各声源对应的信号并产生多个声道的分离信号;语音识别单元,被配置为输入由声源分离单元产生的所述多个声道的分离信号,执行语音识别处理,产生与各声道对应的语音识别结果,并产生用作关于与各声道对应的语音识别结果的评价信息的附加信息;和声道选择单元,被配置为输入所述语音识别结果和所述附加信息,通过应用所述附加信息计算与各声道对应的语音识别结果的得分,选择并输出具有高得分的语音识别结果。
-
公开(公告)号:CN101989424B
公开(公告)日:2012-07-04
申请号:CN201010237405.9
申请日:2010-07-22
Applicant: 索尼公司
CPC classification number: G10L15/183
Abstract: 本发明涉及一种语音处理设备和语音处理方法及程序。该语音处理设备包括:得分计算单元,计算指示在用户说话的基础上输入的语音信号与指示多个意图中的每个意图的多条意图信息中的每条意图信息的符合度的得分;意图选择单元,在由得分计算单元计算的得分的基础上选择所述多条意图信息之中指示用户说话的意图的意图信息;意图可靠性计算单元,在由得分计算单元计算的得分的基础上计算由意图选择单元选择的意图信息的可靠性。
-
公开(公告)号:CN101989424A
公开(公告)日:2011-03-23
申请号:CN201010237405.9
申请日:2010-07-22
Applicant: 索尼公司
CPC classification number: G10L15/183
Abstract: 本发明涉及一种语音处理设备和语音处理方法及程序。该语音处理设备包括:得分计算单元,计算指示在用户说话的基础上输入的语音信号与指示多个意图中的每个意图的多条意图信息中的每条意图信息的符合度的得分;意图选择单元,在由得分计算单元计算的得分的基础上选择所述多条意图信息之中指示用户说话的意图的意图信息;意图可靠性计算单元,在由得分计算单元计算的得分的基础上计算由意图选择单元选择的意图信息的可靠性。
-
公开(公告)号:CN101847405B
公开(公告)日:2012-10-24
申请号:CN201010135852.3
申请日:2010-03-16
Applicant: 索尼公司
CPC classification number: G10L15/1815 , G10L15/183
Abstract: 公开了语音识别装置和方法、语言模型产生装置和方法及程序。所述语音识别装置,包括:一个或多个意图提取语言模型,其中所关注的特定任务的意图是固有的;吸收语言模型,其中任务的任意意图不是固有的;语言分数计算部件,用于计算指示意图提取语言模型和吸收语言模型中的每一个与说话内容之间的语言上的相似度的语言分数;和解码器,用于基于由语言分数计算部件计算出的每个语言模型的语言分数来估计说话内容中的意图。
-
公开(公告)号:CN101847405A
公开(公告)日:2010-09-29
申请号:CN201010135852.3
申请日:2010-03-16
Applicant: 索尼公司
CPC classification number: G10L15/1815 , G10L15/183
Abstract: 公开了语音识别装置和方法、语言模型产生装置和方法及程序。所述语音识别装置,包括:一个或多个意图提取语言模型,其中所关注的特定任务的意图是固有的;吸收语言模型,其中任务的任意意图不是固有的;语言分数计算部件,用于计算指示意图提取语言模型和吸收语言模型中的每一个与说话内容之间的语言上的相似度的语言分数;和解码器,用于基于由语言分数计算部件计算出的每个语言模型的语言分数来估计说话内容中的意图。
-
公开(公告)号:CN1204543C
公开(公告)日:2005-06-01
申请号:CN00137498.2
申请日:2000-12-28
Applicant: 索尼公司
CPC classification number: G06N3/008 , B25J13/003 , B25J19/023 , G06K9/00335 , G10L15/26
Abstract: 公开了一种执行各种动作的机器人装置。麦克风拾取的用户的语音由语音识别器识别。CCD拾取的用户的示意动作由图像识别器识别。行为决定单元根据语音识别器提供的语音信息和图像识别器提供的图像信息,决定机器人装置采取的行为。
-
公开(公告)号:CN102667773A
公开(公告)日:2012-09-12
申请号:CN201080053823.0
申请日:2010-12-02
Applicant: 索尼公司
CPC classification number: G06F17/30681 , G10L15/08 , G10L15/187 , G10L15/22 , G10L2015/025
Abstract: 公开了一种搜索设备、搜索方法和程序,采用该搜索设备、搜索方法和程序,能够鲁棒地搜索对应于输入语音的词串。公开的搜索设备包括:语音识别单元(11),用于对输入语音进行语音识别;匹配单元(16),用于关于多个搜索结果词串中的每个执行搜索结果发音符号串与识别结果发音符号串的匹配,其中,多个搜索结果词串是要成为对应于输入语音的词串的搜索结果的词串,搜索结果发音符号串是表示词串搜索结果的发音的发音符号排列,而识别结果发音符号串是表示输入语音的语音识别结果的发音的发音符号排列;以及输出单元(17),用于基于搜索结果发音符号串与识别结果发音符号串的匹配结果输出搜索结果词串,其中搜索结果词串是从多个搜索结果词串中搜索对应于输入语音的词串而得到的结果。公开的搜索设备例如可以应用于语音搜索。
-
公开(公告)号:CN102074230A
公开(公告)日:2011-05-25
申请号:CN201010540142.9
申请日:2010-11-11
Applicant: 索尼公司
CPC classification number: G10L15/20 , G10L21/0272 , G10L2021/02166
Abstract: 本发明涉及语音识别装置、语音识别方法和程序。该语音识别装置包括:声源分离单元,被配置为把多个声源的输出的混合信号分离成与各声源对应的信号并产生多个声道的分离信号;语音识别单元,被配置为输入由声源分离单元产生的所述多个声道的分离信号,执行语音识别处理,产生与各声道对应的语音识别结果,并产生用作关于与各声道对应的语音识别结果的评价信息的附加信息;和声道选择单元,被配置为输入所述语音识别结果和所述附加信息,通过应用所述附加信息计算与各声道对应的语音识别结果的得分,选择并输出具有高得分的语音识别结果。
-
-
-
-
-
-
-
-
-