三维信息的确定方法、装置、设备及存储介质

    公开(公告)号:CN117115274A

    公开(公告)日:2023-11-24

    申请号:CN202311378630.8

    申请日:2023-10-24

    IPC分类号: G06T7/80 H04N23/80

    摘要: 一种三维信息的确定方法、装置、设备及存储介质,属于图像处理技术领域。本方法可应用于云技术、智慧交通、辅助驾驶等场景。方法包括:获取对被拍摄对象的外平面进行拍摄得到的图像;被拍摄对象的外平面上具有凸起的n个立体单元,立体单元是指具有三维结构的实体单元,n为正整数;对图像进行处理,得到至少一个立体单元的边框信息;边框信息用于在图像中定位立体单元的第一表面和第二表面,第一表面与第二表面平行,且第一表面或第二表面在外平面中;根据立体单元的边框信息,确定立体单元的三维信息;三维信息用于表征立体单元在图像中的位置,以及立体单元在垂直于外平面方向上的凸起程度。本方法有助于降低获取立体单元的三维信息的难度。

    虚拟对象动作生成方法、装置、计算机设备和存储介质

    公开(公告)号:CN116977509A

    公开(公告)日:2023-10-31

    申请号:CN202310574266.6

    申请日:2023-05-19

    摘要: 本申请涉及一种虚拟对象动作生成方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取用于描述虚拟对象动作的动作描述信息;对动作描述信息进行文本特征提取,得到动作描述文本特征,并获取用于生成虚拟对象动作的采样噪声信号;基于动作描述文本特征,对采样噪声信号进行首层级的降噪处理,得到首层级输出的动作特征向量;在首层级之后的每一层级,基于动作描述文本特征和前一层级输出的动作特征向量,对采样噪声信号进行降噪处理,得到级联降噪后的动作特征向量;对级联降噪后的动作特征向量进行解码,得到虚拟对象动作。采用本方法能够提高所生成的虚拟对象动作的准确度。

    一种动画处理方法、装置、设备及存储介质

    公开(公告)号:CN116977507A

    公开(公告)日:2023-10-31

    申请号:CN202310304233.X

    申请日:2023-03-23

    摘要: 本申请实施例提供一种动画处理方法、装置、设备及存储介质,涉及计算机技术领域,包括:获取待眼神调整动画中目标对象的眼球位姿参数和头部位姿参数;结合眼神聚焦点的点信息、眼球位姿参数和头部位姿参数,确定与眼神聚焦点匹配的眼球位姿旋转参数;基于眼球位姿参数、眼球位姿旋转参数和头部位姿参数,确定与眼球位姿旋转参数有骨骼结构关系的头部位姿旋转参数;骨骼结构关系为表示眼球骨骼与头部骨骼之间的结构关系;根据眼球位姿旋转参数和头部位姿旋转参数,对待眼神调整动画中目标对象的位姿进行调整,得到目标对象眼神聚焦到眼神聚焦点的眼神调整后动画,上述方法,消除单个骨骼转动到极限值导致的目标对象僵硬,姿态不协调问题。

    一种读音预测方法、装置及相关产品

    公开(公告)号:CN116959407A

    公开(公告)日:2023-10-27

    申请号:CN202310279558.7

    申请日:2023-03-20

    IPC分类号: G10L13/08 G10L13/02

    摘要: 本申请实施例公开了一种读音预测方法、装置及相关产品,将目标文本中的字符转换为向量表示;从转换得到的多个字符的向量表示中,提取目标多音字的向量表示及目标多音字的关联字符的向量表示;调用多个读音预测模型中与目标多音字对应的读音预测模型;基于目标多音字的向量表示及目标多音字的关联字符的向量表示,利用目标多音字对应的读音预测模型预测目标多音字在目标文本中的读音。可见,目标多音字对应的读音预测模型针对目标多音字进行读音预测,能够对该读音预测模型的读音预测能力进行单独提升,不会对其他多音字的读音预测能力造成影响,由此将不同多音字的读音预测解耦,提高对文本中不同多音字读音预测的准确性。

    虚拟对象的姿态控制方法、装置、计算机设备、存储介质

    公开(公告)号:CN116570921B

    公开(公告)日:2023-09-22

    申请号:CN202310857418.3

    申请日:2023-07-13

    摘要: 本申请涉及一种虚拟对象的姿态控制方法、装置、计算机设备、存储介质和计算机程序产品。该方法可应用于人工智能、游戏应用等领域,游戏应用运行于车载终端或其它设备,包括:对虚拟对象的初始动作序列进行动作频率或动作幅度中的至少一种编辑处理,得到处理后动作序列;初始动作序列是基于动作生成模型所生成的;根据虚拟对象所处地形的地形信息,确定虚拟对象的脚部关节的旋转矩阵;基于处理后动作序列确定虚拟对象的全局动作姿态;依据旋转矩阵对全局动作姿态下的虚拟对象的脚部关节进行旋转,以使脚部关节的局部动作姿态适配于地形。采用本方法能够改善虚拟对象的动作效果,减少穿模率的同时,又能够有效提高不同虚拟对象动作的拟人化效果。

    一种动画处理方法、装置、设备和存储介质

    公开(公告)号:CN116597056A

    公开(公告)日:2023-08-15

    申请号:CN202310863895.0

    申请日:2023-07-14

    IPC分类号: G06T13/40

    摘要: 本申请实施例提供了一种动画处理方法、装置、设备和存储介质,方法包括:获取关于虚拟角色的动画序列和虚拟角色在参考姿态下的角色模型;确定动画序列中目标动画帧的虚拟角色包括的多个关节的局部旋转改变量;多个关节中目标关节的局部旋转改变量是指目标关节相对于角色模型中与目标关节对应的参考关节的旋转改变量;按照运动约束规则对目标动画帧中虚拟角色的各关节的局部旋转改变量进行约束处理,得到各关节对应的局部旋转修正量,并根据各局部旋转修正量得到目标动画帧中虚拟角色的各关节的局部旋转修正参数,进而根据各局部旋转修正参数,得到动画序列中动画帧对应的修正动画帧。这样可批量化、自动化地修复动画序列,降本增效。

    语音动画生成方法、装置、电子设备和介质

    公开(公告)号:CN116564338A

    公开(公告)日:2023-08-08

    申请号:CN202310847814.8

    申请日:2023-07-12

    IPC分类号: G10L21/10 G10L25/30

    摘要: 本申请实施例公开了一种语音动画生成方法、装置、电子设备和介质,可以应用于语音技术等人工智能领域;本申请实施例获取特征提取网络和视素生成网络;通过第一音频数据、以及第一音频数据对应的口型标签,训练特征提取网络,得到训练后的特征提取网络;由训练后的特征提取网络,从第二音频数据中提取音素特征;由视素生成网络,生成音素特征对应的视素特征;通过视素特征、以及第二音频数据对应的音素标签,训练视素生成网络,得到训练后的视素生成网络,以便将训练后的特征提取网络以及训练后的视素生成网络用于生成语音动画。本申请中采用两种不同的音频数据和标签,进行有监督的两阶段训练过程,可以提高生成语音动画的准确性。

    表情信息的获取方法、装置、计算机设备及存储介质

    公开(公告)号:CN116152900A

    公开(公告)日:2023-05-23

    申请号:CN202310405082.7

    申请日:2023-04-17

    IPC分类号: G06V40/16 G06V20/40

    摘要: 本申请提供了一种表情信息的获取方法、装置、计算机设备及存储介质,属于计算机技术领域。该方法包括:对于视频内多个视频帧中的任一视频帧,基于所述视频帧中对象的脸部、形状基和表情基,获取初始形状权重和初始表情权重;基于所述多个视频帧中所述对象的初始表情权重,从所述多个视频帧中获取目标数量的视频帧作为中立脸帧;基于所述目标数量的所述中立脸帧中所述对象的初始形状权重,确定所述对象的全局形状权重初值;基于所述多个视频帧中所述对象的脸部,对所述全局形状权重初值进行迭代,得到全局形状权重;基于所述全局形状权重,从所述视频中获取各个视频帧中所述对象的表情信息。上述方法能够获得更准确的表情信息。

    动捕数据的处理方法、装置、设备及存储介质

    公开(公告)号:CN116051699A

    公开(公告)日:2023-05-02

    申请号:CN202310318727.3

    申请日:2023-03-29

    IPC分类号: G06T13/40 G06T7/00 G06T7/70

    摘要: 本申请实施例公开了一种动捕数据的处理方法、装置、设备及存储介质,属于视频动捕技术领域。该方法包括:对动作视频中的目标对象进行动捕分析,得到原始视频动捕数据;基于所述动作视频,对所述目标对象进行脚接地状态分析,得到各个视频帧中所述目标对象的脚接地数据;基于所述原始视频动捕数据以及所述脚接地数据,确定所述原始视频动捕数据的脚部穿模损失以及脚部滑步损失;基于所述脚部穿模损失以及所述脚部滑步损失,对所述原始视频动捕数据进行迭代优化,得到所述目标对象的目标视频动捕数据;采用本申请实施例提供的方法,能够减少视频动捕数据中存在的脚部穿模问题以及滑步问题,提高视频动捕数据的质量。