-
公开(公告)号:CN115563342A
公开(公告)日:2023-01-03
申请号:CN202211277485.X
申请日:2022-10-19
IPC分类号: G06F16/75 , G06F16/783 , G06F16/738
摘要: 本发明公开了一种视频主题检索的方法、系统、设备及存储介质,用以解决现有技术样例视频的相似度计算是在较低级别上进行的问题。方法包括:S1、预训练跨模态视觉语言模型,并对所述跨模态视觉语言模型进行调整;S2、对给定的样例视频集合的场景进行分割,并对分割后的各样例视频片段的主题进行聚类;S3、基于所述调整后的跨模态视觉语言模型以及聚类的样例视频片段进行视频主题检索,并对检索结果进行聚合和排序后输出。系统包括:预训练和调整模块、分割和聚类模块、输出模块。计算机设备包括:存储器、处理器,以及计算机程序。包含计算机可执行指令的存储介质用于执行视频主题检索的方法。
-
公开(公告)号:CN114880514B
公开(公告)日:2022-11-01
申请号:CN202210781107.9
申请日:2022-07-05
申请人: 人民中科(北京)智能技术有限公司
IPC分类号: G06F16/583 , G06F16/58 , G06V10/75
摘要: 本申请公开了一种图像检索方法、装置以及存储介质。其中,图像检索方法,包括:接收检索信息;确定与所述检索信息关联的文本信息以及图像信息;对所述文本信息以及所述图像信息进行基于注意力机制的特征表示,生成与所述检索信息对应的图像检索特征;以及根据所述图像检索特征,检索与所述检索信息匹配的图像。
-
公开(公告)号:CN118485051A
公开(公告)日:2024-08-13
申请号:CN202410329444.3
申请日:2024-03-21
IPC分类号: G06F40/186 , G06F40/216 , G06F16/35 , G06F18/241 , G06F18/22 , G06N3/0455
摘要: 本发明涉及一种教育公文生成方法、装置、计算机设备及存储介质,其中,该方法包括:获取教育公文生成需求信息,其中,所述需求信息中包括待生成教育公文的类型和描述;将所述需求信息输入至训练好的大语言模型中,生成所述需求信息对应的教育公文,其中,所述训练好的大语言模型为基于不同类型的教育公文的结构、提示词模板以及主题库进行训练而得到的,所述训练好的大语言模型的输入为所述需求信息,输出为所述需求信息对应的教育公文。通过本申请,解决了相关技术缺乏对垂直领域语义概念的关注而导致预训练大语言模型文本生成中内容不符合要求,结构不准确的问题,实现了提高生成教育公文的质量和准确度的效果。
-
公开(公告)号:CN118283380A
公开(公告)日:2024-07-02
申请号:CN202410329443.9
申请日:2024-03-21
IPC分类号: H04N21/84 , H04N21/845 , H04N21/44 , H04N21/234
摘要: 本发明涉及一种视频描述生成方法、装置、计算机设备及存储介质,该方法包括:从目标视频中采样得到视频帧序列;从视频帧序列中提取出多个视觉特征以及语义概念特征;根据多个视觉特征和语义概念特征进行多特征融合编码,得到视频编码特征;基于一组可学习的事件查询以及视频编码特征,使用解码器进行解码,得到多个事件建议表示;利用多个子任务头对多个事件建议表示进行并行解码,得到事件建议集合;从事件建议集合中筛选出目标事件建议作为目标视频的描述结果。通过本申请,解决了相关技术中的密集视频描述方法缺乏对语义概念的关注与利用导致的密集视频描述中事件定位以及事件描述不准确的问题,实现了提升密集视频描述准确度的效果。
-
公开(公告)号:CN114880514A
公开(公告)日:2022-08-09
申请号:CN202210781107.9
申请日:2022-07-05
申请人: 人民中科(北京)智能技术有限公司
IPC分类号: G06F16/583 , G06F16/58 , G06V10/75
摘要: 本申请公开了一种图像检索方法、装置以及存储介质。其中,图像检索方法,包括:接收检索信息;确定与所述检索信息关联的文本信息以及图像信息;对所述文本信息以及所述图像信息进行基于注意力机制的特征表示,生成与所述检索信息对应的图像检索特征;以及根据所述图像检索特征,检索与所述检索信息匹配的图像。
-
-
-
-