-
公开(公告)号:CN118945437A
公开(公告)日:2024-11-12
申请号:CN202411151459.1
申请日:2024-08-21
申请人: 上海创先泰克教育科技有限公司
发明人: 汤峰
IPC分类号: H04N21/80 , H04N21/854 , H04N21/2343 , H04N21/4402
摘要: 本发明公开了一种微册馆自动生成方法、装置、设备及存储介质,通过文本生成模型、图片生成模型和音频生成模型分别生成微册文案、微册背景图和微册背景音乐。计算需求文本与各素材文件之间、需求文本与各模板之间的余弦相似度。然后根据余弦相似度确定候选素材文件集合和候选模板集合。用户根据设计需求选择目标素材和目标模板。基于微册文案、微册背景图、微册背景音乐、目标素材和目标模板生成微册。本发明的方法,用户只需要将素材和需求进行输入,并选择素材和模板,即可通过模型自动生成文案、背景图和背景音乐。最后基于用户选择的素材和模板自动生成微册。减少了人工操作,提高了微册的生成效率,降低了微册生成过程中的出错率。
-
公开(公告)号:CN116939320B
公开(公告)日:2024-06-18
申请号:CN202310687966.6
申请日:2023-06-12
申请人: 南京邮电大学
IPC分类号: H04N21/80 , H04N21/233 , H04N21/234 , H04N21/2343 , H04N21/2383 , H04N21/439 , H04N21/44 , H04N21/4402 , H04N21/438 , G06F18/25 , G06N3/048 , G06N3/0475 , G06N3/0499 , G06N3/0464 , G06N3/0455 , G06N3/09
摘要: 本发明公开了一种生成式多模态互利增强视频语义通信方法,称为MME‑SC。该方法建立在条件生成对抗网络(CGAN)的基础上,旨在使用文本作为主要传输载体,利用不同模态之间的互利增强来实现目标语义信息的精准提取,从而完成视频传输任务。在多模态互利增强网络的帮助下,我们从视频的关键帧图像和音频中提取语义信息,并进行差值处理,以确保提取的文本以更少的比特传达准确的语义信息,从而提高系统的容量。此外,本发明设计了一个多帧语义检测模块,以督促视频生成过程中的语义过渡。仿真结果表明,本发明出的框架在复杂噪声环境中对视频的传输具有较高的鲁棒性,特别是在低信噪比条件下,显著提高了视频通信中语义传输的准确性和符号传输速率。
-
公开(公告)号:CN117041459A
公开(公告)日:2023-11-10
申请号:CN202311015106.4
申请日:2023-08-11
申请人: 深圳市闪剪智能科技有限公司
发明人: 郑海涛
IPC分类号: H04N5/265 , G06F16/735 , G06F16/75 , H04N21/234 , H04N21/44 , H04N21/80
摘要: 本发明提供了一种基于文本的视频生成方法、系统及相关设备,方法包括预先建立视频资源素材库,所述视频资源素材库包括视频前景素材集和视频背景素材集;接收用户输入的文本并确定待生成视频所需的各种素材以及各种所述素材的风格;对所述文本进行转换分析获得各种所述素材的依赖数据,所述依赖数据包括语音数据、字幕数据和关键词数据;基于各种所述素材的所述风格并通过预设的风格匹配规则从所述视频资源素材库中获得各种目标素材;对所述依赖数据和各种所述目标素材进行包装,获得视频各图层数据;基于所述视频各图层数据渲染得到目标视频。本发明文本生成视频的方法除了可以添加背景还可以添加丰富的前景,生成视频更加丰富,趣味性更高。
-
公开(公告)号:CN116939284A
公开(公告)日:2023-10-24
申请号:CN202210320553.X
申请日:2022-03-29
申请人: 北京字跳网络技术有限公司
IPC分类号: H04N21/439 , H04N21/462 , H04N21/80
摘要: 本公开实施例涉及一种素材包的生成方法、视频编辑方法、装置、设备及介质,素材包的生成方法包括:获取目标视频的编辑记录文件;目标视频是通过编辑操作将指定素材合成到初始视频上而得到的视频,编辑记录文件包括用于记录编辑操作的编辑记录信息以及初始视频和指定素材;基于编辑记录文件获取目标素材以及目标素材的应用信息;应用信息包含有目标素材在目标视频中的编辑记录信息,且目标素材属于指定素材;基于目标素材及其应用信息生成用于视频编辑的素材包。上述方式有效提升了素材包的生成及后续使用的便捷性。
-
公开(公告)号:CN112204563A
公开(公告)日:2021-01-08
申请号:CN201980026033.4
申请日:2019-02-15
申请人: 得麦股份有限公司
发明人: J·尼尔森
摘要: 本示教涉及一种用于对场景进行可视化的方法、系统、介质和实施方式。首先,接收具有对视觉场景的描述的输入。在输入上进行语言学处理,以获得输入的语义,语义于是被用于生成用于对视觉场景进行呈现的场景日志。场景日志具体规定以下中的至少一者:视觉场景的背景;将在视觉场景中出现的一个以上的实体/对象;至少一个参数,其与一个以上的实体/对象相关联,将被用于以和输入的语义一致的方式,在背景中对一个以上过的实体/对象进行可视化。于是,基于场景日志,通过根据至少一个参数对背景和一个以上的实体/对象进行可视化,对视觉场景进行呈现。
-
公开(公告)号:CN108293151B
公开(公告)日:2020-12-04
申请号:CN201680063726.7
申请日:2016-11-03
申请人: 高尔纵株式会社
发明人: 朱相炫
IPC分类号: H04N21/80 , H04N21/8549 , H04N5/225
摘要: 本发明旨在提供一种编辑除了进行简单的一杆进洞确认或近洞认证等外,还对正在进行高尔夫比赛的用户予以呈现从高尔夫击球到在包括该进行高尔夫击球的球的目标地点的区域上的移动的一系列过程的影像信息来自动地生成高尔夫影像信息,从而能够向用户提供对高尔夫击球的值得成为纪念的影像内容的高尔夫影像信息自动生成系统及高尔夫影像信息自动生成方法。
-
公开(公告)号:CN110168630A
公开(公告)日:2019-08-23
申请号:CN201880006545.X
申请日:2018-02-03
申请人: 杰创科系统有限公司
摘要: 在耦合到显示器、通信接口和第一图像传感器的电子设备处,从所述第一图像传感器捕获第一图像数据。通过所述通信接口从第一远程设备接收第二图像数据。所述显示器显示所述第二图像数据的一部分与所述第一图像数据的一部分。所述第二图像数据的所显示部分模糊所述第一图像数据中的一些。
-
公开(公告)号:CN104159145B
公开(公告)日:2018-03-09
申请号:CN201410423661.5
申请日:2014-08-26
申请人: 中译语通科技股份有限公司
IPC分类号: H04N21/434 , H04N21/435 , H04N21/80 , G11B27/10
摘要: 本发明是一种针对讲座视频的时间轴自动产生方法,包括以下步骤:第一步,扫描一遍视频,通过小波变换和自相关函数法检测出基音频率;第二步,寻找基音频率的平均值µ和标准差σ,作为讲话人的基因频率;第三步,根据基音频率,进行初划分,划分为时间轴单元;第四步,对于每一个时间轴单元,计算其基音频率相似性A及频谱相似性B,对于A,B取两个阈值,当A和B均大于这两个阈值时,认为是演讲人在说话,排除非演讲人说话的时间轴,得到的时间轴为演讲人说话的时间轴。本发明是一种针对视频讲座可以自动产生出高精度的讲座视频时间轴的方法。
-
公开(公告)号:CN104185085B
公开(公告)日:2017-08-08
申请号:CN201410122428.3
申请日:2014-03-28
申请人: 无锡天脉聚源传媒科技有限公司
发明人: 曹婷
摘要: 本发明公开了一种视频点播方法及装置。所述方法包括以下步骤:当接收到视频搜索指令时,根据搜索关键词搜索关键词对应的视频;当接收到视频点播指令时,播放点播视频,显示点播视频中的视频文字,突出显示点播视频的当前视频文字。本发明实施例中,通过根据搜索关键词搜索关键词对应的视频能够快速获取需要的视频内容,显示点播视频中的视频文字,突出显示点播视频的当前视频文字,使得用户能够更加快速的清晰的通过视频文字获得视频内容。
-
公开(公告)号:CN105474248A
公开(公告)日:2016-04-06
申请号:CN201480046575.5
申请日:2014-06-19
申请人: 塔拉里亚斯特公司
发明人: 安东尼·路易吉·希珀勒塔 , 加布里埃尔·里奎勒·沃尔格尔
IPC分类号: G06Q30/02 , H04N21/478 , H04N21/80 , G06F3/14
摘要: 公开了一种促销和发现与节目内容有关的项目的系统、设备和方法。在一个方面中,该系统包括用于节目内容供应商系统的第一界面,该第一界面被配置成接收与在节目内容中显示的可用于促销的任何项目有关的数据。该系统包括用于一个或多个促销系统的第二界面,其中,各个促销系统包括关于可用于促销的项目的项目细节,该第二界面被配置成接收来自促销系统的项目细节。该系统包括促销生成器,该促销生成器被配置成将在节目内容中显示的项目与来自促销系统的可用于促销的项目进行匹配。该系统包括界面生成器,该界面生成器被配置成向用户显示可用于促销的项目,且向用户提供用以接受与所显示的项目相关联的促销的选项。
-
-
-
-
-
-
-
-
-