-
公开(公告)号:CN115563342A
公开(公告)日:2023-01-03
申请号:CN202211277485.X
申请日:2022-10-19
IPC分类号: G06F16/75 , G06F16/783 , G06F16/738
摘要: 本发明公开了一种视频主题检索的方法、系统、设备及存储介质,用以解决现有技术样例视频的相似度计算是在较低级别上进行的问题。方法包括:S1、预训练跨模态视觉语言模型,并对所述跨模态视觉语言模型进行调整;S2、对给定的样例视频集合的场景进行分割,并对分割后的各样例视频片段的主题进行聚类;S3、基于所述调整后的跨模态视觉语言模型以及聚类的样例视频片段进行视频主题检索,并对检索结果进行聚合和排序后输出。系统包括:预训练和调整模块、分割和聚类模块、输出模块。计算机设备包括:存储器、处理器,以及计算机程序。包含计算机可执行指令的存储介质用于执行视频主题检索的方法。
-
公开(公告)号:CN118820444A
公开(公告)日:2024-10-22
申请号:CN202411280356.5
申请日:2024-09-13
摘要: 本发明公开了一种基于垂直领域知识的智能问答方法,包括以下步骤,基于垂直领域数据类型进行数据划分,根据若干个数据类型构建若干个知识库,并将数据保存至知识库中;知识库包括问答对知识库、知识图谱数据库和文档知识库;基于垂直领域的知识构建LLM微调指令以意图理解垂直领域专业词汇和用户问题涉及的内容;基于划分的数据类型和LLM的微调,构建智能问答核心组件以输出答案。将原始数据划分为三种类型,分别给出相应的技术方案进行解决;并深度融合通用LLM和垂直领域内的数据,通过精细的微调和定制化,使LLM进行意图理解;通过构建智能问答核心组件,给出三种问答模块,在垂直领域提供更准确、更专业的答案。
-
公开(公告)号:CN118334399A
公开(公告)日:2024-07-12
申请号:CN202410075929.4
申请日:2024-01-18
申请人: 人民中科(北京)智能技术有限公司
IPC分类号: G06V10/764 , G06V10/774 , G06V10/40 , G06V30/422
摘要: 本发明公开了一种基于两阶段方法和关键点的地图位置缺失识别方法,包括以下步骤:S1、数据采集以及标注;S2、地图边框检测模型的训练;S3、关键点检测模型的训练;S4、两阶段式识别地图是否存在位置缺失,并输出识别结果。本方法先进行地图的边框检测,之后将特别关注的地图关键区域的中心点(或具有明显标志的位置)作为地图该位置的关键点,进而判别地图是否存在缺失位置。得益于两阶段的方式以及使用关键点热图作为中间表示,即使在图片中干扰信息较多时、地图存在较大变换时、地图的尺寸变化较多时仍旧具有很好的鲁棒性,能够处理互联网海量数据的复杂性和多样性问题,为解决问题地图识别任务提供了新思路。
-
公开(公告)号:CN117786116A
公开(公告)日:2024-03-29
申请号:CN202311854048.4
申请日:2023-12-29
申请人: 人民中科(北京)智能技术有限公司
IPC分类号: G06F16/35 , G06N3/0455 , G06N3/0464 , G06N3/082 , G06N3/096 , G06Q50/18
摘要: 本发明公开了一种基于多层级标签文本分类的公平竞争审查方法,采集大量的政策措施文件以构建政策措施本文信息库;基于库中的文本数据,采用BERT模型对政策语义模型进行训练,保存最终参数;随机选择库中的文本数据,构建审查案例库,并对案例文本进行人工标注;构建基于卷积神经网络的违规类型识别模型,结合标注结果进行训练,保存模型结构及参数;采集待审查文件,利用政策语义模型进行文本特征提取,并结合违规类型识别模型实现待审查文件的违规判断。本发明解决了现有基于同等级标签公平竞争审查模型模型准确率不高,缺少样本数据等问题,提升审查工作智能化水平,提升工作效率,有效解决审查、监管资源不足等问题。
-
公开(公告)号:CN116824710A
公开(公告)日:2023-09-29
申请号:CN202310587326.8
申请日:2023-05-23
申请人: 中国科学院自动化研究所 , 人民中科(北京)智能技术有限公司
IPC分类号: G06V40/40 , G06V40/16 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/08
摘要: 本发明提供一种伪造人脸鉴别方法、装置、设备和存储介质,将待鉴别图像输入人脸鉴别模型;获取人脸鉴别模型输出的待鉴别图像对应的鉴别结果;其中,人脸鉴别模型用于获取待鉴别图像的面部单元一致性特征,并基于待鉴别图像的面部单元一致性特征确定待鉴别图像对应的鉴别结果;待鉴别图像的面部单元一致性特征用于表征待鉴别图像的各面部单元相关区域之间的相关性;人脸鉴别模型是基于样本图像和样本图像对应的鉴别标签训练得到的,提升了对于未知造假方法合成的图像的鉴别效果。
-
公开(公告)号:CN114880514B
公开(公告)日:2022-11-01
申请号:CN202210781107.9
申请日:2022-07-05
申请人: 人民中科(北京)智能技术有限公司
IPC分类号: G06F16/583 , G06F16/58 , G06V10/75
摘要: 本申请公开了一种图像检索方法、装置以及存储介质。其中,图像检索方法,包括:接收检索信息;确定与所述检索信息关联的文本信息以及图像信息;对所述文本信息以及所述图像信息进行基于注意力机制的特征表示,生成与所述检索信息对应的图像检索特征;以及根据所述图像检索特征,检索与所述检索信息匹配的图像。
-
公开(公告)号:CN118283380A
公开(公告)日:2024-07-02
申请号:CN202410329443.9
申请日:2024-03-21
IPC分类号: H04N21/84 , H04N21/845 , H04N21/44 , H04N21/234
摘要: 本发明涉及一种视频描述生成方法、装置、计算机设备及存储介质,该方法包括:从目标视频中采样得到视频帧序列;从视频帧序列中提取出多个视觉特征以及语义概念特征;根据多个视觉特征和语义概念特征进行多特征融合编码,得到视频编码特征;基于一组可学习的事件查询以及视频编码特征,使用解码器进行解码,得到多个事件建议表示;利用多个子任务头对多个事件建议表示进行并行解码,得到事件建议集合;从事件建议集合中筛选出目标事件建议作为目标视频的描述结果。通过本申请,解决了相关技术中的密集视频描述方法缺乏对语义概念的关注与利用导致的密集视频描述中事件定位以及事件描述不准确的问题,实现了提升密集视频描述准确度的效果。
-
公开(公告)号:CN117911768A
公开(公告)日:2024-04-19
申请号:CN202410075930.7
申请日:2024-01-18
申请人: 人民中科(北京)智能技术有限公司
IPC分类号: G06V10/764 , G06T7/11 , G06V10/40 , G06V30/422
摘要: 本发明公开了一种基于关键点检测和颜色不一致判别的问题地图识别方法,包括以下步骤:S1、数据的收集与获取;S2、获取地图边框坐标以及地图关键点坐标之后,进行地图关键位置颜色不一致判别设定;S3、基于关键点检测模型和颜色不一致判别规则,对待测地图进行判别,汇总所有关键点的判别结果,输出地图缺失判别结果。本发明基于关键点检测,能够得到各个关键位置准确的中心点坐标,进而可以根据关键点位置的像素值与地图主体的像素值的相似度来进行颜色不一致的判别,改善了常规的基于目标检测干扰因素多、识别结果精准度差的缺陷。
-
公开(公告)号:CN117555979B
公开(公告)日:2024-04-19
申请号:CN202410040660.6
申请日:2024-01-11
申请人: 人民中科(北京)智能技术有限公司
IPC分类号: G06F16/29 , G06N5/04 , G06V10/25 , G06V10/32 , G06V10/44 , G06V10/52 , G06V10/764 , G06V10/82
摘要: 本发明公开了一种高效的自底向上的地图位置缺失识别方法,包括以下步骤:S1、数据准备;S2、地图关键点检测模型的训练:将数据预处理后组合;进行高分辨率的特征提取;将高分辨率特征转换为热图,并预测每一个关键点的嵌入向量;得到预测结果,与真实标注进行均方差损失计算来反向传播进行模型优化;直至模型优化至达到输出标准,完成训练;S3、模型量化;S4、地图关键点检测模型推理,输出地图位置缺失识别结果。本发明在保证精度的同时提高从海量数据中检测出问题地图的效率,可以直接在输入的图片上定位地图关键点,有着较高的效率;同时需要的计算和存储资源也相对有限,可以满足海量数据的处理以及服务实际部署的需求。
-
公开(公告)号:CN114880514A
公开(公告)日:2022-08-09
申请号:CN202210781107.9
申请日:2022-07-05
申请人: 人民中科(北京)智能技术有限公司
IPC分类号: G06F16/583 , G06F16/58 , G06V10/75
摘要: 本申请公开了一种图像检索方法、装置以及存储介质。其中,图像检索方法,包括:接收检索信息;确定与所述检索信息关联的文本信息以及图像信息;对所述文本信息以及所述图像信息进行基于注意力机制的特征表示,生成与所述检索信息对应的图像检索特征;以及根据所述图像检索特征,检索与所述检索信息匹配的图像。
-
-
-
-
-
-
-
-
-