文本信息处理方法、装置、服务器、存储介质及程序产品

    公开(公告)号:CN115147507A

    公开(公告)日:2022-10-04

    申请号:CN202210749786.1

    申请日:2022-06-28

    摘要: 本公开提供了一种文本信息处理方法、装置、服务器、存储介质及程序产品,可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景。所述方法包括:提取样本文字内容特征和样本风格特征;将样本文字内容特征和样本风格特征进行多次特征融合,得到样本级联融合特征,样本级联融合特征为文字内容及风格样式均增强的特征;基于样本文本信息、样本风格图片、样本文字内容特征及样本级联融合特征,训练字体生成模型。本公开将提取的样本文字内容特征和样本风格特征进行多次融合,融合得到的样本级联融合特征中文字内容及风格样式均被增强,基于该样本级联融合特征所训练的字体生成模型精度更高,基于该模型生成的风格迁移图片效果更佳。

    一种图像处理方法、装置、计算机设备和存储介质

    公开(公告)号:CN111986127A

    公开(公告)日:2020-11-24

    申请号:CN201910429716.6

    申请日:2019-05-22

    IPC分类号: G06T5/50 G06T5/00 G06K9/62

    摘要: 本发明实施例公开了一种图像处理方法、装置、计算机设备和存储介质;本发明实施例可以获取待处理图像,所述待处理图像融合有待推广内容图像;对所述待处理图像进行上下文特征提取,得到所述待处理图像的上下文特征信息;基于所述上下文特征信息提取所述待处理图像中对象的多层语义信息;基于所述上下文特征信息和所述多层语义信息进行图像重建,得到重建后图像。该方案可以提升图像融合效果。

    视频生成方法、装置、设备、存储介质和计算机程序产品

    公开(公告)号:CN116977394A

    公开(公告)日:2023-10-31

    申请号:CN202211092969.7

    申请日:2022-09-08

    摘要: 本申请涉及一种视频生成方法、装置、计算机设备、存储介质和计算机程序产品。该方法涉及人工智能的计算机视觉技术,该视频生成方法包括:获取原始图像以及原始图像对应的原始深度图,根据原始深度图,确定原始图像中的前景边缘区域;前景边缘区域位于原始图像的前景区域中、且邻近原始图像的背景区域,基于原始图像与原始深度图,对原始图像中的前景边缘区域进行背景颜色和背景深度的补全处理,得到背景区域向前景区域延伸形成的补全图像与补全深度图,分别对原始图像与原始深度图所对应的三维网格、和补全图像与补全深度图所对应的三维网格渲染后融合,生成原始图像对应的目标视频。本方案能够提升视频生成的准确性与效率。

    广告生成方法、装置、计算机可读介质及电子设备

    公开(公告)号:CN116957669A

    公开(公告)日:2023-10-27

    申请号:CN202211514795.9

    申请日:2022-11-29

    摘要: 本申请属于广告设计技术领域,涉及一种广告生成方法、装置、计算机可读介质及电子设备,包括:获取图片素材和广告文案,对所述广告文案进行语音合成以生成与所述广告文案对应的语音信息;获取虚拟主播模型,根据所述广告文案或者所述语音信息确定与所述虚拟主播模型对应的展示参数,并根据所述图片素材、所述语音信息和所述展示参数对所述虚拟主播模型进行渲染生成虚拟主播口播视频;基于所述虚拟主播口播视频创建广告。本申请一方面能够减少人力成本,另一方面能够提升广告的多样性,而不受模板设计师的创意思路的限制,避免了PAG视频模板种类少所导致的图片素材、广告文案与模板的匹配度差的问题。

    虚拟对象的视频生成方法、装置和计算机可读存储介质

    公开(公告)号:CN117014675B

    公开(公告)日:2024-07-23

    申请号:CN202211127727.7

    申请日:2022-09-16

    摘要: 本申请实施例公开了一种虚拟对象的视频生成方法、装置和计算机可读存储介质;通过获取虚拟对象对应的原始脸部三维数据以及音频数据;根据目标频率对音频数据进行特征提取,得到目标频率特征,并对音频数据进行线性预测特征提取,得到线性预测特征;将目标频率特征以及线性预测特征进行融合,得到虚拟对象的目标音频特征;根据目标音频特征和原始脸部三维数据对虚拟对象的脸部数据进行预测,得到表征目标部位状态变化的目标脸部数据;根据目标脸部数据和音频数据生成目标部位状态与音频数据相匹配的视频数据。以此,提高视频数据中目标部位与音频数据匹配的准确性,进而提高虚拟对象的视频生成准确性,进一步提升虚拟对象的视频生成效率。

    一种虚拟表情的生成方法以及相关装置

    公开(公告)号:CN117011429A

    公开(公告)日:2023-11-07

    申请号:CN202211122675.4

    申请日:2022-09-15

    摘要: 本申请实施例公开了一种虚拟表情的生成方法以及相关装置,至少涉及人工智能等技术,能够让虚拟表情更加贴近于情绪真实的反映效果。该方法包括获取目标虚拟角色的包括至少一个音频帧的待处理音频,每个音频帧的时间步不相同;对每个音频帧分别进行特征提取处理、情感特征提取处理,得到每个音频帧的音频特征、每个音频帧的音频情感特征,每个音频情感特征用于指示目标虚拟角色在播放对应音频帧时的情绪表征;将每个音频帧的音频特征和音频情感特征作为虚拟表情生成模型的输入,生成目标虚拟角色在待处理音频中的虚拟表情结果,虚拟表情结果包括至少一个时间步不相同的虚拟表情,每个时间步不相同的虚拟表情分别与对应时间步的音频帧对应。

    一种图像处理方法、装置、设备及存储介质、程序产品

    公开(公告)号:CN115147532A

    公开(公告)日:2022-10-04

    申请号:CN202210704119.1

    申请日:2022-06-21

    摘要: 本申请提供了一种图像处理方法、装置、设备及存储介质、程序产品,可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景。其中,该方法包括:对目标图像进行元素识别,得到目标图像的至少一个关键元素;基于各个关键元素在目标图像中的位置,确定水波纹在目标图像中的水波中心点;确定目标图像中与水波中心点的距离为预设距离的目标像素点;根据水波纹参数,对目标像素点进行水波纹特效渲染,得到多个渲染图像;根据每个渲染图像对应的时间节点,对多个渲染图像进行拼接,生成目标图像的水波纹特效视频。采用本申请,可以增强水波纹特效的真实感,提高图像的美观性和趣味性。

    视频生成方法、装置、计算机设备及存储介质

    公开(公告)号:CN118052912A

    公开(公告)日:2024-05-17

    申请号:CN202211399961.5

    申请日:2022-11-09

    摘要: 本申请实施例公开了一种视频生成方法、装置、计算机设备及存储介质,属于计算机技术领域。该方法包括:获取待由虚拟对象播报的播报文本;对播报文本进行情感分析,得到播报文本所属的情感类型;基于播报文本所属的情感类型,确定与播报文本匹配的表情数据,表情数据指示的表情所表达的情感属于情感类型;基于表情数据驱动虚拟对象,得到包括虚拟对象的播报画面,以使播报画面中虚拟对象的表情为表情数据指示的表情;基于播报文本对应的播报音频和播报画面,生成播报视频,播报视频包括播报音频和播报画面。本申请在节约了人工拍摄视频所花费的时间的基础上,还达到了虚拟对象绘声绘色地朗读播报文本的效果,提高了生成播报视频的效率以及真实性。

    虚拟资源处理方法、装置、介质及电子设备

    公开(公告)号:CN113761281B

    公开(公告)日:2024-05-14

    申请号:CN202110455932.5

    申请日:2021-04-26

    发明人: 吴高 殷泽龙

    IPC分类号: G06F16/783

    摘要: 本申请的实施例提供了一种虚拟资源处理方法、装置、介质及电子设备。该方法包括:识别指定视频文件中所包含的目标展示主体,并提取所述目标展示主体的主体特征数据;根据所述目标展示主体的主体特征数据,确定与所述主体特征数据相对应的视频虚拟资源素材;基于所述目标展示主体和所述视频虚拟资源素材,生成视频虚拟资源;将所述视频虚拟资源呈现在所述指定视频文件中。本申请实施例的技术方案可以提高生成的视频文件的内容协调性。