-
公开(公告)号:CN107967706A
公开(公告)日:2018-04-27
申请号:CN201711209170.0
申请日:2017-11-27
Applicant: 腾讯音乐娱乐科技(深圳)有限公司
CPC classification number: G06T13/205 , G06T13/80
Abstract: 本发明实施例公开了一种多媒体数据的处理方法、装置及计算机可读存储介质,属于多媒体技术领域。多媒体数据的处理方法,包括:获取待处理的视频数据,视频数据中包括节奏变化的音频数据;提取视频数据中所包括的音频数据的节奏变化信息,节奏变化信息包括至少一组相互对应的节奏变化时间点和节奏变化强度;根据视频数据中所包括的音频数据的节奏变化信息,对视频数据的视频画面进行动画特效处理,得到处理后的视频数据。通过提取视频数据中所包括的音频数据的节奏变化信息,根据音频数据的节奏变化信息对视频数据的视频画面进行动画特效处理,使得视频内容能够与音频数据的节奏关联起来,丰富了多媒体数据的处理方式,进而可以扩展应用场景。
-
公开(公告)号:CN103971393A
公开(公告)日:2014-08-06
申请号:CN201410050837.7
申请日:2014-01-29
Applicant: 株式会社东芝
Inventor: J·拉多勒-马丁内兹 , V·P·L·万 , B·斯腾格尔 , R·安德森 , R·滋波拉
CPC classification number: G06T13/80 , G06T13/205 , G10L13/08 , G10L21/10 , G10L25/63 , G10L2021/105
Abstract: 本发明涉及计算机生成的头部。一种动画制作计算机生成头部的方法,头部具有根据要由头部输出的语音动作的嘴部,方法包括:提供与要由嘴唇动作输出的语音相关的输入;将输入分成声音单元序列;为输入文本选择表情特性;使用统计模型将声音单元序列转换为图像矢量序列,其中模型具有描述将声音单元与图像矢量相关的概率分布的多个模型参数,图像矢量包括定义头部的脸部的多个参数;以及将图像矢量序列输出为视频,这样头部的嘴部动作以用选择的表情模仿与输入文本相关联的语音其中将选择的表情中每个概率分布的预定类型的参数表示为相同类型的参数的加权之和,并且其中所用的权重为表情相关的,其中按簇提供参数,并且每个簇包括至少一个子簇。
-
公开(公告)号:CN101379807A
公开(公告)日:2009-03-04
申请号:CN200680053119.9
申请日:2006-02-21
Applicant: 诺基亚公司
CPC classification number: G10H1/368 , G06T13/205 , G06T13/80 , G10H2210/031 , G10H2230/021 , H04M1/575 , H04M19/04
Abstract: 一种创建用于与音乐报警同步显示的视频序列的方法,包括:选择一个或者多个图像;根据用于音乐报警的音乐元数据来修改一个或者多个所选图像以创建视频序列,其中修改的范围和/或类型依赖于音乐元数据;以及与音乐报警一起播放视频序列。
-
公开(公告)号:CN101151641A
公开(公告)日:2008-03-26
申请号:CN200680010119.0
申请日:2006-02-02
Applicant: 三菱电机株式会社
CPC classification number: G10H1/0008 , G06T11/001 , G06T13/205 , G10H2210/031 , G10H2220/005 , G10H2250/031
Abstract: 本发明揭示一种带图像显示的音乐装置,具有:从音乐信息提取该音乐信息中包含的多个特性的特性提取单元103;生成根据由特性提取单元提取的多个特性的各特性而相应进行不同变化的图像的图像生成单元105~111;以及显示用图像生成单元生成的图像的监视器112。
-
公开(公告)号:CN1645413A
公开(公告)日:2005-07-27
申请号:CN200510004742.2
申请日:2005-01-18
Applicant: 日本电气株式会社
Inventor: 吉村成弘
CPC classification number: G06T13/205 , G06K9/00335 , G06T11/00 , G06T13/40 , G10L17/26 , G10L21/06
Abstract: 一种图像处理设备,根据图像和语音数据来确定感情,然后输出装饰图像或替代图像。另外,为了对信号进行分析,精确地确定语音信号的分段。与提取图像的构成元素和连续地监视元素的动作的操作一起来进行感情分析。期间观察到没有嘴唇动作的周期和期间未输入语音的周期用作语音信号的分割点,并确定语音中的感情。另外,对根据图像数据的分析结果和根据语音数据的分析结果进行加权以便最终确定感情,并输出与该感情相对应的合成图像或替代图像。
-
公开(公告)号:CN1321287A
公开(公告)日:2001-11-07
申请号:CN00801784.0
申请日:2000-06-21
Applicant: 皇家菲利浦电子有限公司
Inventor: N·海斯马 , J·G·辛克 , B·A·J·贝格维特 , H·A·W·范格斯特尔
IPC: G06T15/70
CPC classification number: G06T13/205 , G06T9/001 , G06T13/40
Abstract: 本发明提供一种对信息流后期同步的方法。根据图象信号(V)获得原来口型对象(1o)。这些原来口型对象(1o)被新口型对象(1o*)所替代,新口型对象对应翻译后语音信号(A*)。可以根据图象信号(V)通过利用面向对象的编码技术获得口型对象(1o),例如,MPEG-4。编码标准MPEG-4提供对操纵口型对象(1o)的帮助。出现几个设计。新口型对象(1o*)可以通过跟踪进一步图象信号或通过利用具有可视语义位或口型参数的数据库获得。本发明适合于通信网络,例如电视会议。多种语言信息流包括多个语音信号(A,A*)和每个连接到语音信号(A,A*)之一的多个口型对象(1o,1o*)。这给出了在接收机选择所希望语言的可能性。本发明的优点是口型运动更好地对应翻译后语音。
-
公开(公告)号:CN101983396B
公开(公告)日:2014-07-09
申请号:CN200980111893.4
申请日:2009-03-24
Applicant: 皇家飞利浦电子股份有限公司
Inventor: X·周 , P·M·C·莱门斯 , A·A·M·L·布鲁克斯 , A·A·托克马科夫 , E·M·哈特德鲁伊特-贝克 , S·P·P·普龙克
CPC classification number: G09B11/00 , G06T13/205 , G06T13/40
Abstract: 本发明涉及基于用户指令修改表示的方法以及通过所述方法产生经修改的表示的系统。常规的绘图系统,如笔和纸以及书写板,需要并非所有用户都拥有的适度的绘图技能。此外,这些常规的系统产生静态的绘图。本发明的方法包括接收来自第一用户的表示,将该表示与输入对象类别相关联,接收来自第二用户的指令,将该指令与动画类别相关联,利用该输入对象类别和动画类别确定所述表示的修改,并利用所述修改来修改所述表示。当第一用户提供某事物的表示,例如故事中的人物时,通过将其与对象类别关联进行一定程度的标识。换句话说,确定最佳的可能的匹配。当第二用户想象涉及所述表示的故事时,该故事的动态元素以一种或多种通信形式,如笔迹、语音、手势、面部表情来展示。通过从这些信号中获得指令,所述表示可以被修改或制成动画,以说明故事中的动态元素。这改进了对用户的反馈,并增加了用户的乐趣。
-
公开(公告)号:CN101925949A
公开(公告)日:2010-12-22
申请号:CN200980102937.7
申请日:2009-01-14
Applicant: 索尼公司
CPC classification number: G10H1/0008 , G06T13/205 , G10H1/368 , G10H2220/005 , G10H2240/085 , G10L25/00
Abstract: 一种用于从音频数据获得至少一个动画参数的方法,所述动画参数描述所述音频数据的情绪,该方法包括如下步骤:对于所述音频数据确定当前情绪模型;对于至少一个参考模型计算至少一个距离量度,其中,所述距离量度代表所述当前情绪模型和各自参考情绪模型间的距离;根据所述距离量度来设置至少一个动画参数。
-
公开(公告)号:CN101151641B
公开(公告)日:2010-07-21
申请号:CN200680010119.0
申请日:2006-02-02
Applicant: 三菱电机株式会社
CPC classification number: G10H1/0008 , G06T11/001 , G06T13/205 , G10H2210/031 , G10H2220/005 , G10H2250/031
Abstract: 本发明揭示一种带图像显示的音乐装置,具有:从音乐信息提取该音乐信息中包含的多个特性的特性提取单元103;生成根据由特性提取单元提取的多个特性的各特性而相应进行不同变化的图像的图像生成单元105~111;以及显示用图像生成单元生成的图像的监视器112。
-
公开(公告)号:CN101669090A
公开(公告)日:2010-03-10
申请号:CN200880013046.X
申请日:2008-04-28
Applicant: 福特全球技术公司
Inventor: 迪米塔·彼特诺夫·菲利夫 , 奥莱格·由里维奇·古斯京 , 埃里克·克拉夫 , 陈一帆 , 法扎尔·阿拉曼·塞伊德 , 佩里·麦尼尔 , 马克·申德 , 托马斯·吉由里 , 巴萨瓦拉杰·托恩沙尔
IPC: G06F3/048
CPC classification number: G06T13/40 , A61B5/165 , A61B5/18 , A61B5/4803 , A61B5/7264 , A61B5/744 , B60W50/10 , B60W2040/089 , G01C21/3608 , G06F3/011 , G06F19/00 , G06F2203/011 , G06N3/006 , G06T13/205 , G10L17/26
Abstract: 可以将关于装置的信息带感情地传达给装置的用户。可接收指示装置的运行状态的输入。可以将所述输入变换成表示模拟情绪状态的数据。可产生及显示表示表达所述模拟情绪状态的虚拟形象的数据。可从用户接收与虚拟形象表达的模拟情绪状态有关的询问。可对所述询问做出答复。
-
-
-
-
-
-
-
-
-