多模态协同交互的短视频标签预测方法及系统

    公开(公告)号:CN118334549A

    公开(公告)日:2024-07-12

    申请号:CN202410372491.6

    申请日:2024-03-29

    发明人: 沈耀 俞子越

    摘要: 一种多模态协同交互的短视频标签预测方法及系统,构建并采用包含短视频集,短视频所对应的发布用户集以及所对应的标签集的短视频样本数据集输入多模态协同交互短视频标签预测模型,通过多层感知机预测模块将不同视角下的三种信息协同交互得到短视频的综合特征并生成标签预测得分,再以期望短视频的真实标签为目标,计算预测出的候选标签和真实标签之间的特征区别损失,通过迭代实现训练;迭代完成训练之后,将训练后的多模态协同交互短视频标签预测模型对短视频样本进行预测以生成目标视频的标签预测对。本发明充分利用了用户个性化倾向对标签预测的特异性;模型能够自适应的学习更新标签语义之间的关系权重,更加全面学习标签语义的为效果;模型在短视频标签预测领域取得了更高的准确率。

    一种测试方法、装置、电子设备及计算机存储介质

    公开(公告)号:CN114598930B

    公开(公告)日:2024-06-18

    申请号:CN202210203147.5

    申请日:2022-03-02

    发明人: 舒清

    摘要: 本发明提供一种测试方法、装置、电子设备及计算机存储介质,包括在对任一移动客户端中的视频应用进行测试时,获取视频应用的播放数据,播放数据至少包括播放开关参数和播放地址;按照预设埋点数据对基于播放开关参数和播放地址播放的视频应用进行测试;获取与预设埋点数据对应的抓包数据;对抓包数据进行分析处理,得到对应的测试结果。在本发明实施例中,通过基于播放开关参数和播放地址控制视频应用播放对应视频,并按照预设埋点数据对视频应用进行测试,以获取与预设埋点数据对应的抓包数据;对抓包数据进行分析处理,得到对应的测试结果,从而进行播放器专项功能进行验证。通过上述方式能够提高测试结果的准确性。

    资源显示方法、装置、电子设备及存储介质

    公开(公告)号:CN118158481A

    公开(公告)日:2024-06-07

    申请号:CN202410251558.0

    申请日:2022-05-31

    发明人: 李静

    摘要: 本公开关于一种资源显示方法、装置、电子设备及存储介质,属于互联网技术领域,该方法包括:响应于针对目标视频的播放页面的截屏操作,基于该截屏操作对应的视频内容从目标数据库中搜索目标资源,基于该目标资源的资源信息,在该播放页面中显示该目标资源的交互信息。通过上述技术方案,由截屏操作触发资源搜索过程,能够快速地、及时地感知到潜在的用户需求,从而基于截屏操作对应的视频内容,准确贴合由视频内容触发的用户需求进行搜索,并聚合平台上的多个交互渠道,提供覆盖全平台的丰富信息来源,从而精准地搜索到与用户需求关联的资源,进而基于资源信息直接在播放页面中显示与用户需求关联的资源的交互信息,大大提升了人机交互效率。

    基于交互式自然语言处理生成动态图片的设备和方法

    公开(公告)号:CN117716694A

    公开(公告)日:2024-03-15

    申请号:CN202280049605.2

    申请日:2022-05-04

    申请人: 任旭彬

    发明人: 任旭彬

    摘要: 本发明一般涉及通过对由用户提供的场景执行自然语言处理来自动创建视频的技术。具体地,本发明涉及一种基于交互式自然语言处理来自动生成动态图片的技术,该技术在针对多个单元故事存储一个或更多个模板图像时,经由自然语言处理将用户场景划分为多个分段的持续时间,根据用户选择针对相应的分段的持续时间设置匹配模板图像,并且然后通过将经由用户照片创建的用户角色与相应模板图像合成并将这些模板图像彼此连接来生成动态图片。

    一种线下叙事总控连接的方法和装置

    公开(公告)号:CN117255235A

    公开(公告)日:2023-12-19

    申请号:CN202311511702.1

    申请日:2023-11-14

    发明人: 任志忠

    IPC分类号: H04N21/8545 H04N13/261

    摘要: 本发明实施例提供一种线下叙事总控连接的方法和装置,该方法包括:获取多路输入源的第一叙事内容,根据第一叙事内容设置至少一个叙事空间,通过多线路空间控制器控制用户叙事端设置第一叙事内容;根据第一叙事内容设置至少一个第一叙事元件;多线路空间控制器与第一叙事元件进行交互得到第二叙事内容;根据第二叙事内容设置至少一个第二叙事元件,获取第二叙事内容中视频信息中的第一像素信息,对第一像素信息按照设定的叙事规则进行重新编排和转换得到第二像素信息;所述多线路空间控制器根据第二叙事内容控制第二叙事元件在工作时段将第二像素信息输出至对应的叙事空间中。该方法可以让用户在同一个时刻和操作下获得不同的叙事体验。

    一种视频合成方法、装置、电子设备和存储介质

    公开(公告)号:CN113660528B

    公开(公告)日:2023-08-25

    申请号:CN202110565463.2

    申请日:2021-05-24

    摘要: 本发明提供一种视频合成方法、装置、电子设备和存储介质。所述方法包括:获取视频模板;响应于用户对视频模板的选择指令,获取并呈现可选的空间类型;响应于用户对空间类型的选择指令,获取并呈现用户所选择空间类型对应的可选镜头组;获取用户选择的镜头组,根据所述镜头组的预设规则模拟镜头的运动路径;根据镜头运动轨迹和画面设置,并按照视频模板对应模板动画片段的目标时长,计算路径运动速度,并生成动画片段;获取镜头运动路径终点位置和相机设置,渲染生成定点渲染图片;将动画片段和定点渲染图片,导入视频模板的相应位置中,合成视频。本发明只需重点渲染定格图片,快速生成预定路径的视频片段,实现低成本快速生成家装展示视频。

    一种音视频匹配与分发系统及方法

    公开(公告)号:CN112866788B

    公开(公告)日:2023-04-25

    申请号:CN202011622883.1

    申请日:2020-12-31

    摘要: 本申请公开了一种音视频匹配与分发系统及方法,该系统基于智能识别技术和共享经济理念,实现了共享拍摄的功能,该系统使得用户只需要通过终端即可实现从共享的采集模块和云服务器中提取包括目标人脸图像的目的,一方面无需用户随身携带音视频采集器等设备,也可实现在预设场景中各个位置处的目标音视频片段的获取,另一方面分布于预设场景的音视频采集器实时采集音视频资源,实现了对某些稍纵即逝的画面的采集,再一方面,该系统中的采集模块和云服务器均无需用户接触即可实现目标音视频片段的下载,即在实现共享采集模块和云服务器的基础上,避免了人为接触可能导致的损坏和磨损问题。

    一种显示设备及交互应用的启动方法

    公开(公告)号:CN115550725A

    公开(公告)日:2022-12-30

    申请号:CN202211275528.0

    申请日:2022-10-18

    摘要: 本申请一些实施例中公开了一种显示设备及交互应用的启动方法,该方法将交互应用和频道进行解耦,这样显示设备在启动交互应用时无需同时播放与交互应用对应的频道,提高用户的体验。该方法包括:当接收到显示交互应用列表的指令时,控制显示器显示交互应用列表,所述交互应用列表包括交互应用控件;当接收到选中交互应用控件的指令时,检测与所述交互应用控件对应的交互应用的类型;如果所述交互应用的类型为宽带应用,则从存储器获取交互应用的第一网页入口;启动与所述第一网页入口对应的交互应用;如果所述交互应用的类型为广播应用,则从存储器获取交互应用的第一资源文件;启动与所述第一资源文件对应的交互应用。