一种视频信息分析方法及装置、电子设备、存储介质

    公开(公告)号:CN118072298A

    公开(公告)日:2024-05-24

    申请号:CN202410281926.6

    申请日:2024-03-12

    摘要: 本申请公开了一种视频信息分析方法及装置、电子设备、存储介质,所述方法包括:获取待处理视频;分别针对每项目标信息,从待处理视频中识别出目标信息对应的识别结果,并对目标信息的识别结果进行分析处理,得到目标信息对应的关联信息;其中,目标信息包括文字信息、角色信息及场景信息;文字信息对应的识别结果包括从待处理视频的多帧视频帧中识别出的各个部分文字的文字识别结果及其位置信息;该位置信息用于过滤掉文字识别结果中的边缘文字;角色信息对应的识别结果包括从待处理视频的多帧视频帧中识别出的角色脸部信息;场景信息对应的识别结果包括从待处理视频的各个分镜中识别出的分镜内容信息;将各项目标信息对应的关联信息汇总并反馈。

    一种自动生成有声剧的方法及装置

    公开(公告)号:CN117240983B

    公开(公告)日:2024-01-26

    申请号:CN202311528250.8

    申请日:2023-11-16

    摘要: 本发明提供了一种自动生成有声剧的方法及装置,该方法包括:提取待转换影视剧的原视频的音轨信息;将待转换影视剧对应的有声剧剧本按照旁白和台词的顺序进行切分,以得到依序排列的有声剧旁白和有声剧台词;确定候选台词,候选台词为与影视剧台词对应的有声剧台词;基于候选台词从有声剧旁白中确定旁白原始语料;对旁白原始语料进行改写,得到待插入旁白;生成待插入旁白的旁白语音;将音轨信息、待插入旁白和旁白语音进行视频合成,得到待转换影视剧对应的有声剧,实现自动生产影视剧对应的有声剧,从而提高有声剧的产出效率。

    一种视频处理方法及相关设备
    7.
    发明公开

    公开(公告)号:CN114973366A

    公开(公告)日:2022-08-30

    申请号:CN202210588529.4

    申请日:2022-05-27

    摘要: 本公开提供的一种视频处理方法及相关设备,可以获得第一视频中待检测表情的至少一个第一图像帧;将第一图像帧输入至预设表情检测模型中,获得预设表情检测模型输出的表情检测结果,表情检测结果包括第一图像帧中人脸图像的人脸表情结果以及与人脸表情结果对应的第一表情置信度;至少利用预设视频时间长度的滑动窗口,在第一视频中确定出多个第二视频;对任一第二视频:利用该第二视频中包括的各第一图像帧对应的第一表情置信度,确定该第二视频对应的情绪置信度;根据情绪置信度,在各第二视频中获得预设数量的第三视频。本公开通过情绪置信度,能够准确识别出长视频中人物情绪激动的视频片段,有助于提高短视频的生产效率以及长视频的引流推广。

    一种视频抠图方法、装置、存储介质和设备

    公开(公告)号:CN113436097A

    公开(公告)日:2021-09-24

    申请号:CN202110705446.4

    申请日:2021-06-24

    摘要: 本申请公开了一种视频抠图方法、装置、存储介质和设备,利用人体检测跟踪模型,计算得出视频中类型为人体的遮挡物的掩膜。利用肤色分类器,计算得出视频中类型为手部的遮挡物的掩膜。利用背景差分算法,计算得出视频中类型为运动物体的遮挡物的掩膜。利用AI模型,计算得出视频中类型为不规则物体的遮挡物的掩膜。对各个掩膜进行高斯平滑,得到与每个掩膜对应的目标掩膜,对于每个目标掩膜,利用目标掩膜与目标植入物体图像,计算得出与目标掩膜对应的被遮挡区域,并更改被遮挡区域在目标视频帧中的图层,使得图层置于目标视频帧的最底层。相较于现有技术,本申请所述方案,无需人工进行逐帧抠图,效率较高。

    动态三维广告植入方法、装置、电子设备及存储介质

    公开(公告)号:CN113345022A

    公开(公告)日:2021-09-03

    申请号:CN202110757432.7

    申请日:2021-07-05

    摘要: 本发明提供一种动态三维广告植入方法、装置、电子设备及存储介质,对于视频片段内的标定帧和后续帧,结合特征点检测方法和光流跟踪技术可以追踪标定帧中特征点在后续帧中的位置坐标,基于此产生特征点的三维点云和拍摄视频相机移动时的相机参数,以重投影方式将标定帧中的三维广告图层贴合于所述后续帧中。本发明能实现在视频片段内植入三维广告,与人工植入相比,极大提升了植入效率,同时也大大降低了植入成本,而且本发明产生的植入效果能达到人眼无法区分后期植入,可以投入应用。

    一种视频中字幕字符的识别方法及装置

    公开(公告)号:CN111414908A

    公开(公告)日:2020-07-14

    申请号:CN202010182005.6

    申请日:2020-03-16

    摘要: 本发明提供了一种视频中字幕字符的识别方法及装置,方法包括:获取原始视频帧,裁剪掉所述原始视频帧的上部预设区域,得到第一预设尺寸的待识别视频帧;将待识别视频帧输入字幕位置检测模型中进行处理,得到字幕在待识别视频帧中的位置;根据字幕在待识别视频帧中的位置,对待识别视频帧进行裁剪,并将裁剪后得到的图像的尺寸调整为第二预设尺寸得到字幕图像;将字幕图像输入字符识别模型中进行处理,由于字符识别模型是对改进后的CRNN模型训练得到的,利用改进后的CRNN模型中的densenet对字幕图像进行特征提取,提高特征提取的准确性,然后将提取的特征输入1*1卷积层,1*1卷积层相对于耗时较长的循环层处理速度较快,提高了字符识别的处理速度。