-
公开(公告)号:CN105190477A
公开(公告)日:2015-12-23
申请号:CN201380074691.3
申请日:2013-12-11
Applicant: 索尼公司
CPC classification number: G06F3/017 , G02B27/017 , G02B2027/0138 , G02B2027/014 , G02B2027/0178 , G02B2027/0187 , G06F3/011 , G06F3/0482 , G06F3/04842
Abstract: 一种信息处理设备包括电路,电路被配置成提供用户接口,以控制多个可控制对象。用户接口与由传感器的预定检测区域所限定的手势识别区域相关联。基于要由用户接口所控制的可控制对象的数量手势识别区域被分割为多个手势识别子区域。电路还被配置检测在预定检测区域内的预定手势,确定在其中检测到预定手势的手势识别子区域,以及基于所检测到的预定手势和在其中检测到预定手势的所确定的手势识别子区域,对可控制对象中的一个可控制对象执行操作。
-
公开(公告)号:CN103207985A
公开(公告)日:2013-07-17
申请号:CN201310003815.0
申请日:2013-01-06
Applicant: 索尼公司
IPC: G06K9/00 , G06K9/46 , H04N21/422
CPC classification number: G06K9/00335 , G06F3/005 , G06F3/017 , G06K9/00228 , G06K9/00355 , G06K9/00744 , G06K9/4661 , G06K9/52 , G06K9/6215 , G06K2009/4666 , G06T7/20 , G06T7/254 , G06T7/60 , G06T7/74 , G06T2207/20076 , G06T2207/20081 , G06T2207/30201
Abstract: 一种图像处理装置,包括:差异图像生成单元,其通过获得剪切图像的帧之间的差异生成差异图像,其中所述剪切图像是通过剪切出所拍摄的图像上的预定区域而获得的;特征量提取单元,其从差异图像中提取特征量;以及识别单元,其基于从按时间顺序排列的多个差异图像中获得的特征量来识别在所拍摄的图像上的对象的具体运动。
-
公开(公告)号:CN101847405B
公开(公告)日:2012-10-24
申请号:CN201010135852.3
申请日:2010-03-16
Applicant: 索尼公司
CPC classification number: G10L15/1815 , G10L15/183
Abstract: 公开了语音识别装置和方法、语言模型产生装置和方法及程序。所述语音识别装置,包括:一个或多个意图提取语言模型,其中所关注的特定任务的意图是固有的;吸收语言模型,其中任务的任意意图不是固有的;语言分数计算部件,用于计算指示意图提取语言模型和吸收语言模型中的每一个与说话内容之间的语言上的相似度的语言分数;和解码器,用于基于由语言分数计算部件计算出的每个语言模型的语言分数来估计说话内容中的意图。
-
公开(公告)号:CN101847405A
公开(公告)日:2010-09-29
申请号:CN201010135852.3
申请日:2010-03-16
Applicant: 索尼公司
CPC classification number: G10L15/1815 , G10L15/183
Abstract: 公开了语音识别装置和方法、语言模型产生装置和方法及程序。所述语音识别装置,包括:一个或多个意图提取语言模型,其中所关注的特定任务的意图是固有的;吸收语言模型,其中任务的任意意图不是固有的;语言分数计算部件,用于计算指示意图提取语言模型和吸收语言模型中的每一个与说话内容之间的语言上的相似度的语言分数;和解码器,用于基于由语言分数计算部件计算出的每个语言模型的语言分数来估计说话内容中的意图。
-
公开(公告)号:CN110998719A
公开(公告)日:2020-04-10
申请号:CN201880049934.0
申请日:2018-07-27
Applicant: 索尼公司
Abstract: 本技术涉及一种允许更方便的语音交互的信息处理设备和信息处理方法。本技术提供了一种包括处理单元的信息处理设备,该处理单元根据语音之间在意义方面的相关性来连接包括在用户的语音中的中断前后的语音,从而提供更方便的语音交互。本技术可以应用于例如语音对话系统。
-
公开(公告)号:CN1290034C
公开(公告)日:2006-12-13
申请号:CN200310116312.0
申请日:2001-10-11
Applicant: 索尼公司
CPC classification number: G06N3/008 , B25J9/1602 , G05B2219/33053 , G05B2219/33056 , G05B2219/35453 , G05B2219/39254
Abstract: 一种通过根据传感器单元(120)获得的信息等改变在情感单元(130)中的感情等而显示出作为自主行为的信息捕获行为的机器人装置。所述机器人装置包括:行为控制部件,用于提供语言捕获行为;意义捕获部件;以及控制部件,用于执行指示其自身学习对象的行为控制。所述机器人装置将基于对象的内部状态变化和所述对象彼此相关地存储在存储器部件中。
-
公开(公告)号:CN1853879A
公开(公告)日:2006-11-01
申请号:CN200610085065.6
申请日:2001-10-11
Applicant: 索尼公司
CPC classification number: G06N3/008 , B25J9/1602 , G05B2219/33053 , G05B2219/33056 , G05B2219/35453 , G05B2219/39254
Abstract: 一种通过根据传感器单元(120)获得的信息等改变在情感单元(130)中的感情等而显示出作为自主行为的信息捕获行为的机器人装置。所述机器人装置包括:行为控制部件,用于提供语言捕获行为;意义捕获部件;以及控制部件,用于执行指示其自身学习对象的行为控制。所述机器人装置将基于对象的内部状态变化和所述对象彼此相关地存储在存储器部件中。
-
公开(公告)号:CN1236422C
公开(公告)日:2006-01-11
申请号:CN02802184.3
申请日:2002-05-01
Applicant: 索尼公司
CPC classification number: G10L13/047 , G10L13/00 , G10L15/06 , G10L15/24 , G10L2015/0631
Abstract: 发音信息生成单元(150)生成从CCD摄像机(20)拍摄的图像的字符识别结果推导出的多个字符、从该字符推导出的多个假名读音以及与该假名读音对应的发音信息,将获得的多个读音与话筒(23)采集到的用户的发音进行匹配以从多个生成的候选中指定一个假名读音和发音信息(读音)。
-
公开(公告)号:CN1157712C
公开(公告)日:2004-07-14
申请号:CN01800736.8
申请日:2001-02-16
Applicant: 索尼公司
CPC classification number: G10L15/08 , G10L15/18 , G10L2015/085
Abstract: 一种提高语音识别准确度并且避免增加资源的语音识别装置。根据声学分值和语言学分值选择可能为语音识别结果的词,同时还根据不是声学分值的测度,如“音素数目少”、“特定语音部分”、“包含在语音识别过去结果中”和“语言学分值高于预设值”,选择词。并且对如此选择的词进行匹配处理。
-
公开(公告)号:CN105190477B
公开(公告)日:2018-09-21
申请号:CN201380074691.3
申请日:2013-12-11
Applicant: 索尼公司
Abstract: 一种信息处理设备包括电路,电路被配置成提供用户接口,以控制多个可控制对象。用户接口与由传感器的预定检测区域所限定的手势识别区域相关联。基于要由用户接口所控制的可控制对象的数量手势识别区域被分割为多个手势识别子区域。电路还被配置检测在预定检测区域内的预定手势,确定在其中检测到预定手势的手势识别子区域,以及基于所检测到的预定手势和在其中检测到预定手势的所确定的手势识别子区域,对可控制对象中的一个可控制对象执行操作。
-
-
-
-
-
-
-
-
-