-
公开(公告)号:CN115035451A
公开(公告)日:2022-09-09
申请号:CN202210674065.9
申请日:2022-06-15
申请人: 咪咕文化科技有限公司 , 中国移动通信集团有限公司
摘要: 本发明公开了一种视频的切换识别方法、装置、设备和介质,所述方法包括:根据第一特征提取权重获取选定视频帧序列中的每一视频帧对应的第一特征图,所述第一特征提取权重基于所述选定视频帧序列的帧序依次递减;根据第二特征提取权重获取所述选定视频帧序列中每一视频帧对应的第二特征图,所述第二特征提取权重基于所述选定视频帧序列的帧序依次递增;根据所述第一特征图和所述第二特征图,确定所述选定视频帧序列中的中间帧是否为切换视频帧。本发明提高了视频拆分识别效率。
-
公开(公告)号:CN114898465A
公开(公告)日:2022-08-12
申请号:CN202210508201.7
申请日:2022-05-11
申请人: 咪咕文化科技有限公司 , 中国移动通信集团有限公司
IPC分类号: G06V40/20 , G06V10/40 , G06V10/774 , G06V10/80
摘要: 本发明公开了动作边界检测模型、模型训练方法、设备及存储介质,该动作边界检测模型包括:时序动作提名网络用于根据视频特征预测动作候选区域;时序单向特征处理模块,用于根据视频特征提取动作候选区域对应的时序单向特征;线性插值采样模块,用于基于动作候选区域,截取时序单向特征中的待识别特征;动作检测网络,用于根据动作候选区域以及待识别特征确定动作片段对应的动作类别、实际起始时刻以及实际结束时刻。本发明提高了检测视频中动作类别和动作边界的检测效率和准确性。
-
公开(公告)号:CN113052025B
公开(公告)日:2024-08-13
申请号:CN202110270423.5
申请日:2021-03-12
申请人: 咪咕文化科技有限公司 , 中国移动通信集团有限公司
IPC分类号: G06V40/16 , G06V10/774 , G06T5/50
摘要: 本申请公开了一种图像融合模型的训练方法、图像融合方法及电子设备,属于计算机技术领域。其中,图像融合模型的训练方法包括:获取样本图像;接收第一用户作用于目标图像中的第一目标人脸图像上的第一输入,并基于所述第一输入构建标签数据集合,所述标签数据集合包括至少一个标签数据组,所述目标图像为所述样本图像中至少一张图像;基于所述至少一个标签数据组构建损失函数,并基于所述损失函数对图像融合模型进行训练,以得到训练后的图像融合模型;其中,所述损失函数包括正负样本监督信号的放大因子。本申请能够解决相关技术中对图像处理操作较为繁琐的问题。
-
公开(公告)号:CN113052025A
公开(公告)日:2021-06-29
申请号:CN202110270423.5
申请日:2021-03-12
申请人: 咪咕文化科技有限公司 , 中国移动通信集团有限公司
摘要: 本申请公开了一种图像融合模型的训练方法、图像融合方法及电子设备,属于计算机技术领域。其中,图像融合模型的训练方法包括:获取样本图像;接收第一用户作用于目标图像中的第一目标人脸图像上的第一输入,并基于所述第一输入构建标签数据集合,所述标签数据集合包括至少一个标签数据组,所述目标图像为所述样本图像中至少一张图像;基于所述至少一个标签数据组构建损失函数,并基于所述损失函数对图像融合模型进行训练,以得到训练后的图像融合模型;其中,所述损失函数包括正负样本监督信号的放大因子。本申请能够解决相关技术中对图像处理操作较为繁琐的问题。
-
公开(公告)号:CN112584061A
公开(公告)日:2021-03-30
申请号:CN202011548104.8
申请日:2020-12-24
申请人: 咪咕文化科技有限公司 , 中国移动通信集团有限公司
IPC分类号: H04N5/262 , G06F40/186 , H04N21/84
摘要: 本发明公开了一种多媒体通用模板生成方法、电子设备及存储介质,方法包括:确定通用的文件封装结构;通用的文件封装结构包括:媒体文件和通用的描述文件;通用的描述文件包括:与多媒体通用模板中的各轨道分别对应的子描述文件,用于描述多媒体通用模板中相应轨道中媒体文件的封装状况;根据多媒体通用模板中与各轨道分别对应的子描述文件以及所述媒体文件,生成多媒体通用模板。本发明在进行通用模板生成时,采用轨道管理的方式确定多媒体通用模板各轨道中媒体文件的封装状况,从而能够比较清晰地对模板中出现的场景尤其是并行场景进行有效管理。本发明可以得到一种清晰有序的、通用的媒体素材封装技术标准,能够解决各家平台模板的兼容性问题。
-
公开(公告)号:CN114897670A
公开(公告)日:2022-08-12
申请号:CN202210508195.5
申请日:2022-05-11
申请人: 咪咕文化科技有限公司 , 中国移动通信集团有限公司
摘要: 本发明公开了风格化图片生成方法、装置、设备及存储介质,该方法包括:确定待处理的目标图片对应的目标风格类型和属性特征向量,并根据属性特征向量确定目标图片对应的风格强度特征;提取目标图片的全局属性特征;根据目标风格类型查找预设风格特征库,得到目标风格类型匹配的风格特征;将全局属性特征、风格特征和风格强度特征进行拼接得到融合特征,并根据融合特征生成目标图片对应的风格化图片。本发明实现了风格化图片生成的多样性,使得目标图片中的目标对象与风格化图片的风格更加协调。
-
公开(公告)号:CN114863335A
公开(公告)日:2022-08-05
申请号:CN202210486843.1
申请日:2022-05-06
申请人: 咪咕文化科技有限公司 , 中国移动通信集团有限公司
摘要: 本申请实施例提供一种动作关键点确定方法、装置、系统、电子设备及存储介质,涉及视频处理技术领域,以解决现有技术中动作关键点定位效率较低的问题。其中方法包括:将卷积特征图和对象关键点热力图进行帧内融合,以生成空域特征融合图,其中,所述卷积特征图通过对视频段逐帧进行卷积特征提取而生成,所述对象关键点热力图通过对所述视频段逐帧进行对象关键点检测而生成;将所述空域特征融合图沿着时序维度进行堆叠,以生成时空综合特征图;基于所述时空综合特征图和目标对象的时空检测框,生成所述目标对象的时空热力图;基于所述目标对象的时空热力图,确定所述视频段中所述目标对象的动作关键点的时间信息和位置信息。
-
公开(公告)号:CN114820889A
公开(公告)日:2022-07-29
申请号:CN202210447561.0
申请日:2022-04-26
申请人: 咪咕文化科技有限公司 , 中国移动通信集团有限公司
摘要: 本发明公开了一种视频动画生成方法、装置、设备及存储介质,该方法包括:将去噪后的目标用户语音转换为纯净语音;根据目标用户语音的语音特征确定目标用户语音对应的特定原始语音;将纯净语音的语音特征、特定原始语音的语音特征和目标图像的图像特征进行融合,获得视频动画。由于本发明是通过将去噪后的目标用户语音转换为纯净语音,根据目标用户语音的语音特征确定对应的特定原始语音,再将纯净语音的语音特征、特定原始语音的语音特征和目标图像的图像特征融合生成视频动画,能够将输入语音中的噪音去除,并根据纯净语音、特定原始语音和目标图像生成视频动画,可以保证视频动画流畅平滑,提高了视频动画的质量。
-
公开(公告)号:CN114676281A
公开(公告)日:2022-06-28
申请号:CN202210294620.5
申请日:2022-03-24
申请人: 咪咕文化科技有限公司 , 中国移动通信集团有限公司
摘要: 本发明公开了一种歌曲评论的生成方法、系统、终端设备及存储介质。该方法包括:获取待评论歌曲;通过预先创建的评论生成器确定所述待评论歌曲的至少一种评论角度,并根据所述评论角度生成歌曲评论。本发明通过评论生成器生成待评论歌曲的歌曲评论,其中,歌曲评论可从歌手角度、歌词角度、心情角度及时事热点角度自动生成,使得评论多样化,提高了用户体验。
-
公开(公告)号:CN113033344B
公开(公告)日:2024-04-12
申请号:CN202110260415.2
申请日:2021-03-10
申请人: 咪咕文化科技有限公司 , 中国移动通信集团有限公司
IPC分类号: G06V40/16 , G06V10/82 , G06V10/766 , G06N3/0464 , G06N3/096 , G06T5/50
摘要: 本发明提供一种图像处理方法、装置及电子设备,该方法包括:获取多帧图像;将每帧图像中的各个人物映射至综合面部状态特征空间,得到每帧图像中各个人物的综合面部状态特征向量;根据每帧图像中各个人物的综合面部状态特征向量,计算每帧图像的合照面部状态和谐度,并选择合照面部状态和谐度最高的图像作为目标图像;从所有帧图像中为每个人物分别选取一帧图像上的人脸作为目标人脸融合源,将目标图像中目标人物的人脸替换为所述目标人物对应的目标人脸融合源;本发明实施例以每帧图像为维度,跨越不同人物选取最优人脸融合源,生成所有成员面部状态最一致的合照,激活人与人之间的关联关系对合照生成过程的驱动效果,令合照体验更和谐。
-
-
-
-
-
-
-
-
-