-
公开(公告)号:CN1302056A
公开(公告)日:2001-07-04
申请号:CN00137498.2
申请日:2000-12-28
申请人: 索尼公司
CPC分类号: G06N3/008 , B25J13/003 , B25J19/023 , G06K9/00335 , G10L15/26
摘要: 公开了一种执行各种动作的机器人装置。麦克风拾取的用户的语音由语音识别器识别。CCD拾取的用户的示意动作由图像识别器识别。行为决定单元根据语音识别器提供的语音信息和图像识别器提供的图像信息,决定机器人装置采取的行为。
-
公开(公告)号:CN1244902C
公开(公告)日:2006-03-08
申请号:CN02802578.4
申请日:2002-06-07
申请人: 索尼公司
发明人: 赫尔穆特·卢克
IPC分类号: G10L15/06
CPC分类号: G10L15/07 , G10L15/065
摘要: 一种语音识别装置,其能够对多个用户作高精确度的语音识别。根据用存储单元(13)中存储的一个或多个变换函数变换输入声音的变换结果,模型自适应单元(12)检测最佳地使输入声音适应声学模型的变换函数,并将输入声音分配给最佳变换函数。此外,自适应单元(12)通过使用分配给变换函数的所有输入声音,更新:为其分配了新输入声音的变换函数。选择单元(14)在存储单元(13)中存储的一个或多个变换函数中选择用来变换输入声音的变换函数,而变换单元(5)通过使用所选择的变换函数变换输入声音。匹配单元(6)在用变换函数变换的输入声音和声学模型之间执行匹配。本发明适用于用来识别声音的装置。
-
公开(公告)号:CN1465043A
公开(公告)日:2003-12-31
申请号:CN02802578.4
申请日:2002-06-07
申请人: 索尼公司
发明人: 赫尔穆特·卢克
IPC分类号: G10L15/06
CPC分类号: G10L15/07 , G10L15/065
摘要: 一种语音识别装置,其能够对多个用户作高精确度的语音识别。根据用存储单元(13)中存储的一个或多个变换函数变换输入声音的变换结果,模型自适应单元(12)检测最佳地使输入声音适应声学模型的变换函数,并将输入声音分配给最佳变换函数。此外,自适应单元(12)通过使用分配给变换函数的所有输入声音,更新:为其分配了新输入声音的变换函数。选择单元(14)在存储单元(13)中存储的一个或多个变换函数中选择用来变换输入声音的变换函数,而变换单元(5)通过使用所选择的变换函数变换输入声音。匹配单元(6)在用变换函数变换的输入声音和声学模型之间执行匹配。本发明适用于用来识别声音的装置。
-
公开(公告)号:CN1204543C
公开(公告)日:2005-06-01
申请号:CN00137498.2
申请日:2000-12-28
申请人: 索尼公司
CPC分类号: G06N3/008 , B25J13/003 , B25J19/023 , G06K9/00335 , G10L15/26
摘要: 公开了一种执行各种动作的机器人装置。麦克风拾取的用户的语音由语音识别器识别。CCD拾取的用户的示意动作由图像识别器识别。行为决定单元根据语音识别器提供的语音信息和图像识别器提供的图像信息,决定机器人装置采取的行为。
-
-
-