-
公开(公告)号:CN118629394A
公开(公告)日:2024-09-10
申请号:CN202411099358.4
申请日:2024-08-12
申请人: 湖南快乐阳光互动娱乐传媒有限公司
IPC分类号: G10L13/08 , G10L13/033 , G06N3/0455 , G06N3/084
摘要: 本申请公开了一种中性音色的语音合成方法及相关装置,涉及音频处理技术领域,确定中性音色提示音频和中性音色模型,将待合成的目标文本和中性音色提示音频输入到中性音色模型中,由中性音色模型输出目标文本对应的中性音色音频。基于本发明,通过输入文本即可合成具有中性音色的音频,中性音色位于男性音色与女性音色之间,以此消除语音合成时的性别特征,具有广泛适用性。
-
公开(公告)号:CN118551846A
公开(公告)日:2024-08-27
申请号:CN202410995919.2
申请日:2024-07-24
申请人: 湖南快乐阳光互动娱乐传媒有限公司
IPC分类号: G06N5/04 , G06N5/022 , G06N3/006 , G06N3/0455 , G06N3/096 , G06F16/332 , G06F16/33 , G06F40/35 , G06F16/35 , G10L15/26
摘要: 本发明提供一种应用于节目的智能交互方法、系统、电子设备及存储介质,应用于预先构建的AI导演,采集用户输入的语音,并将语音转换成文本;若关键词文档库中不存在文本匹配的关键词文档,且问答库中不存在文本匹配的文本答案,对文本进行意图识别,得到相应的意图识别结果;根据意图识别结果判断用户是否在进行节目制作;若用户在进行节目制作,利用意图识别结果中意图类别相关联的下游工具根据文本执行相应的意图任务,得到并输出相应的节目制作文本,使用户利用节目制作文本制作相应的节目;若用户未进行节目制作,获取文本相关的垂直领域知识;通过拟人大模型根据文本和垂直领域知识生成的第一提示语输出相应的文本答案。
-
公开(公告)号:CN118072298A
公开(公告)日:2024-05-24
申请号:CN202410281926.6
申请日:2024-03-12
申请人: 湖南快乐阳光互动娱乐传媒有限公司
IPC分类号: G06V20/62 , G06V30/148 , G06V20/40 , G06V10/762
摘要: 本申请公开了一种视频信息分析方法及装置、电子设备、存储介质,所述方法包括:获取待处理视频;分别针对每项目标信息,从待处理视频中识别出目标信息对应的识别结果,并对目标信息的识别结果进行分析处理,得到目标信息对应的关联信息;其中,目标信息包括文字信息、角色信息及场景信息;文字信息对应的识别结果包括从待处理视频的多帧视频帧中识别出的各个部分文字的文字识别结果及其位置信息;该位置信息用于过滤掉文字识别结果中的边缘文字;角色信息对应的识别结果包括从待处理视频的多帧视频帧中识别出的角色脸部信息;场景信息对应的识别结果包括从待处理视频的各个分镜中识别出的分镜内容信息;将各项目标信息对应的关联信息汇总并反馈。
-
公开(公告)号:CN117768739A
公开(公告)日:2024-03-26
申请号:CN202311819548.4
申请日:2023-12-27
申请人: 湖南快乐阳光互动娱乐传媒有限公司
IPC分类号: H04N21/478 , H04N21/44 , H04N21/4722 , G06V40/16
摘要: 本申请公开了一种视频商品关联推荐方法、系统及电子设备,通过获得视频帧图像,即可对视频帧图像中存在的商品进行识别,并确定视频帧图像中与该商品关联的目标对象,从而实现对视频帧图像中出现的商品及目标对象的关联输出,实现对视频帧图像中感兴趣商品的精确识别及推荐,提高了用户体验。
-
公开(公告)号:CN117376634B
公开(公告)日:2024-03-08
申请号:CN202311676881.4
申请日:2023-12-08
申请人: 湖南快乐阳光互动娱乐传媒有限公司
IPC分类号: H04N21/439 , H04N21/44 , H04N21/472
-
公开(公告)号:CN117240983B
公开(公告)日:2024-01-26
申请号:CN202311528250.8
申请日:2023-11-16
申请人: 湖南快乐阳光互动娱乐传媒有限公司
IPC分类号: H04N5/265 , H04N21/434 , H04N21/439 , H04N21/81
摘要: 本发明提供了一种自动生成有声剧的方法及装置,该方法包括:提取待转换影视剧的原视频的音轨信息;将待转换影视剧对应的有声剧剧本按照旁白和台词的顺序进行切分,以得到依序排列的有声剧旁白和有声剧台词;确定候选台词,候选台词为与影视剧台词对应的有声剧台词;基于候选台词从有声剧旁白中确定旁白原始语料;对旁白原始语料进行改写,得到待插入旁白;生成待插入旁白的旁白语音;将音轨信息、待插入旁白和旁白语音进行视频合成,得到待转换影视剧对应的有声剧,实现自动生产影视剧对应的有声剧,从而提高有声剧的产出效率。
-
公开(公告)号:CN114973366A
公开(公告)日:2022-08-30
申请号:CN202210588529.4
申请日:2022-05-27
申请人: 湖南快乐阳光互动娱乐传媒有限公司
IPC分类号: G06V40/16 , G06V20/40 , H04N21/845
摘要: 本公开提供的一种视频处理方法及相关设备,可以获得第一视频中待检测表情的至少一个第一图像帧;将第一图像帧输入至预设表情检测模型中,获得预设表情检测模型输出的表情检测结果,表情检测结果包括第一图像帧中人脸图像的人脸表情结果以及与人脸表情结果对应的第一表情置信度;至少利用预设视频时间长度的滑动窗口,在第一视频中确定出多个第二视频;对任一第二视频:利用该第二视频中包括的各第一图像帧对应的第一表情置信度,确定该第二视频对应的情绪置信度;根据情绪置信度,在各第二视频中获得预设数量的第三视频。本公开通过情绪置信度,能够准确识别出长视频中人物情绪激动的视频片段,有助于提高短视频的生产效率以及长视频的引流推广。
-
公开(公告)号:CN113436097A
公开(公告)日:2021-09-24
申请号:CN202110705446.4
申请日:2021-06-24
申请人: 湖南快乐阳光互动娱乐传媒有限公司
摘要: 本申请公开了一种视频抠图方法、装置、存储介质和设备,利用人体检测跟踪模型,计算得出视频中类型为人体的遮挡物的掩膜。利用肤色分类器,计算得出视频中类型为手部的遮挡物的掩膜。利用背景差分算法,计算得出视频中类型为运动物体的遮挡物的掩膜。利用AI模型,计算得出视频中类型为不规则物体的遮挡物的掩膜。对各个掩膜进行高斯平滑,得到与每个掩膜对应的目标掩膜,对于每个目标掩膜,利用目标掩膜与目标植入物体图像,计算得出与目标掩膜对应的被遮挡区域,并更改被遮挡区域在目标视频帧中的图层,使得图层置于目标视频帧的最底层。相较于现有技术,本申请所述方案,无需人工进行逐帧抠图,效率较高。
-
公开(公告)号:CN113345022A
公开(公告)日:2021-09-03
申请号:CN202110757432.7
申请日:2021-07-05
申请人: 湖南快乐阳光互动娱乐传媒有限公司
摘要: 本发明提供一种动态三维广告植入方法、装置、电子设备及存储介质,对于视频片段内的标定帧和后续帧,结合特征点检测方法和光流跟踪技术可以追踪标定帧中特征点在后续帧中的位置坐标,基于此产生特征点的三维点云和拍摄视频相机移动时的相机参数,以重投影方式将标定帧中的三维广告图层贴合于所述后续帧中。本发明能实现在视频片段内植入三维广告,与人工植入相比,极大提升了植入效率,同时也大大降低了植入成本,而且本发明产生的植入效果能达到人眼无法区分后期植入,可以投入应用。
-
公开(公告)号:CN111414908A
公开(公告)日:2020-07-14
申请号:CN202010182005.6
申请日:2020-03-16
申请人: 湖南快乐阳光互动娱乐传媒有限公司
摘要: 本发明提供了一种视频中字幕字符的识别方法及装置,方法包括:获取原始视频帧,裁剪掉所述原始视频帧的上部预设区域,得到第一预设尺寸的待识别视频帧;将待识别视频帧输入字幕位置检测模型中进行处理,得到字幕在待识别视频帧中的位置;根据字幕在待识别视频帧中的位置,对待识别视频帧进行裁剪,并将裁剪后得到的图像的尺寸调整为第二预设尺寸得到字幕图像;将字幕图像输入字符识别模型中进行处理,由于字符识别模型是对改进后的CRNN模型训练得到的,利用改进后的CRNN模型中的densenet对字幕图像进行特征提取,提高特征提取的准确性,然后将提取的特征输入1*1卷积层,1*1卷积层相对于耗时较长的循环层处理速度较快,提高了字符识别的处理速度。
-
-
-
-
-
-
-
-
-