-
公开(公告)号:CN1324517C
公开(公告)日:2007-07-04
申请号:CN03803809.9
申请日:2003-02-05
申请人: 皇家飞利浦电子股份有限公司
CPC分类号: G10L17/02 , G06K9/00228 , G10L15/24
摘要: 本发明公开了一种用于确定视频数据中谁是说话者的方法和系统。这可用于在视频内容分析和检索应用中加入人员认证。一相关性用于提高依赖于面部识别和说话者认证的所述人员识别率。隐性语义关联(LSA)处理也可用于提高说话者面部与其声音的关联性。可以结合其他的数据源(例如,文本)用于更广领域的视频内容理解应用。
-
公开(公告)号:CN1662956A
公开(公告)日:2005-08-31
申请号:CN03814215.5
申请日:2003-06-04
申请人: 皇家飞利浦电子股份有限公司
IPC分类号: G10L17/00
摘要: 一种存储器,存储用于使与大量说话人识别(ID)系统相关联的处理器实例化包括以下项的功能的计算机可读指令:音频分段和分类功能(F10),接收一般音频数据(GAD),并且产生多个段;特征提取功能(F12),接收这些段,并且从中提取基于Me1倒谱系数(MFCC)的特征;学习和聚类功能(14),接收所提取的特征,并且根据所提取的特征在必要时对段进行重新分类;匹配和标注功能(16),将说话人ID分配给GAD内的语音信号;以及数据库功能,用于将所分配的说话人ID与GAD内的相应语音信号相联系。音频分段和分类功能可以将每个段分配给N个音频信号类之一,其中N个音频信号类包括静默、单个说话人的语音、音乐、环境噪声、多个说话人的语音、同时语音和音乐、以及语音和噪声。
-
公开(公告)号:CN1860504A
公开(公告)日:2006-11-08
申请号:CN200480028227.1
申请日:2004-09-28
申请人: 皇家飞利浦电子股份有限公司
CPC分类号: G06T13/205 , G06K9/00268 , G06K9/6277 , G06T13/40 , G10L2021/105 , H04N21/23412 , H04N21/2368 , H04N21/42203 , H04N21/4307 , H04N21/4312 , H04N21/4314 , H04N21/4341 , H04N21/4751 , H04N21/8106
摘要: 提供了一种用于在视频图像处理器中合成视听内容的系统和方法。内容合成应用处理器从表示正在讲话的讲话者的视听输入信号中提取音频特征和视频特征。处理器使用所提取的视觉特征来创建讲话者脸部的计算机产生的动画模型。然后处理器使讲话者脸部的动画模型的面部运动与用于表示讲话者谈话的多个音频逻辑单元(诸如音素)同步。依照这种方式处理器合成讲话者脸部的视听表示,其与讲话者谈话准确地同步。
-
公开(公告)号:CN1703694A
公开(公告)日:2005-11-30
申请号:CN02824562.8
申请日:2002-11-20
申请人: 皇家飞利浦电子股份有限公司
IPC分类号: G06F17/30
CPC分类号: G06F17/30787 , G06F17/30793 , G06F17/30796 , G06F17/30828
摘要: 一种信息跟踪设备从一个或多个信息源接收诸如视频或电视信号之类的内容数据,并且根据查询条件来分析所述内容数据以便提取相关报道。所述查询条件运用了各种各样的信息,比如但不限于:用户请求、用户简档以及已知关系的知识库。利用所述查询条件,信息跟踪设备计算人物或事件出现在内容数据中的概率,并相应地定位和提取报道。对结果进行索引、排序,并继而将其显示在显示设备上。
-
公开(公告)号:CN1672210A
公开(公告)日:2005-09-21
申请号:CN03817764.1
申请日:2003-07-17
申请人: 皇家飞利浦电子股份有限公司
CPC分类号: G11B27/329 , G11B27/28 , G11B2220/20
摘要: 本发明提供用于为节目生成基于内容的内容表格的方法、系统和程序产品。具体地,本发明确定具有片断的节目的类型。一旦确定了类型,为每个片断分配分类。基于片断中的视频内容、音频内容和文本内容分配分类。基于类型和分类,从片断中选择关键帧,用于在基于内容的内容表格中使用。
-
公开(公告)号:CN1633670A
公开(公告)日:2005-06-29
申请号:CN03803809.9
申请日:2003-02-05
申请人: 皇家飞利浦电子股份有限公司
CPC分类号: G10L17/02 , G06K9/00228 , G10L15/24
摘要: 本发明公开了一种用于确定视频数据中谁是说话者的方法和系统。这可用于在视频内容分析和检索应用中加入人员认证。一相关性用于提高依赖于面部识别和说话者认证的所述人员识别率。隐性语义关联(LSA)处理也可用于提高说话者面部与其声音的关联性。可以结合其他的数据源(例如,文本)用于更广领域的视频内容理解应用。
-
公开(公告)号:CN1723455B
公开(公告)日:2010-09-08
申请号:CN200380103280.9
申请日:2003-11-07
申请人: 皇家飞利浦电子股份有限公司
IPC分类号: G06F17/30
CPC分类号: G06K9/00711 , G06F17/30026 , G06F17/30035 , G06F17/30047 , G06F17/30743 , G06F17/30775 , G06F17/30787 , G06F17/30799 , Y10S707/99933
摘要: 一种使用户能够查询一种媒体形态的多媒体档案并且自动检索另一媒体形态的相关数据且不需要人工地通过数据结构来关联数据项的方法和系统。该相关方法在不受数据在每种形态的相应子空间中的分布的影响的情况下,可以查找数据项之间的最大相关性。一旦揭示了相关性的方向,就可以把已提取的特征从一个子空间转换到另一子空间。
-
公开(公告)号:CN100505072C
公开(公告)日:2009-06-24
申请号:CN03817764.1
申请日:2003-07-17
申请人: 皇家飞利浦电子股份有限公司
CPC分类号: G11B27/329 , G11B27/28 , G11B2220/20
摘要: 本发明提供用于为节目生成基于内容的内容表格的方法、系统和程序产品。具体地,本发明确定具有片断的节目的类型。一旦确定了类型,为每个片断分配分类。基于片断中的视频内容、音频内容和文本内容分配分类。基于类型和分类,从片断中选择关键帧,用于在基于内容的内容表格中使用。
-
公开(公告)号:CN100438615C
公开(公告)日:2008-11-26
申请号:CN03807595.4
申请日:2003-04-01
申请人: 皇家飞利浦电子股份有限公司
IPC分类号: H04N7/16
CPC分类号: H04N21/454 , H04N5/445 , H04N7/163 , H04N7/17318 , H04N21/4307 , H04N21/4331 , H04N21/4532 , H04N21/4622 , H04N21/4722 , H04N21/4782 , H04N21/482 , H04N21/6581 , H04N21/84 , H04N21/8586
摘要: 提供一种为视频节目提供补充信息226的方法,所述方法包括为视频节目接收补充信息226。接收来自用户的请求。所述请求与补充信息226的特定部分相关。基于补充信息226的特定部分向用户提供请求响应。
-
公开(公告)号:CN1723455A
公开(公告)日:2006-01-18
申请号:CN200380103280.9
申请日:2003-11-07
申请人: 皇家飞利浦电子股份有限公司
IPC分类号: G06F17/30
CPC分类号: G06K9/00711 , G06F17/30026 , G06F17/30035 , G06F17/30047 , G06F17/30743 , G06F17/30775 , G06F17/30787 , G06F17/30799 , Y10S707/99933
摘要: 一种使用户能够查询一种媒体形态的多媒体档案并且自动检索另一媒体形态的相关数据且不需要人工地通过数据结构来关联数据项的方法和系统。该相关方法在不受数据在每种形态的相应子空间中的分布的影响的情况下,可以查找数据项之间的最大相关性。一旦揭示了相关性的方向,就可以把已提取的特征从一个子空间转换到另一子空间。
-
-
-
-
-
-
-
-
-