-
公开(公告)号:CN115690645A
公开(公告)日:2023-02-03
申请号:CN202211120031.1
申请日:2022-09-14
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院自动化研究所
IPC: G06V20/40 , G06V10/764 , G06V10/82 , G06V10/77 , G06V10/46 , G06V10/44 , G06V10/42 , G06V10/50 , G06N3/0464 , G06N3/0442 , G06N3/0455 , G06N3/0895 , G10L25/51 , G10L25/30 , G10L25/03
Abstract: 本发明提供一种视频检测方法、装置、设备、存储介质及程序产品,该方法包括:获取待处理视频;对待处理视频的图像进行视觉特征提取,得到视觉特征信息;对待处理视频的语音进行音频特征提取,得到音频特征信息;基于视觉特征信息和音频特征信息,确定待处理视频是否为安全视频。本发明提供的视频检测方法、装置、设备、存储介质及程序产品用于提高对待处理视频进行安全检测的准确性。
-
公开(公告)号:CN115019087A
公开(公告)日:2022-09-06
申请号:CN202210557333.9
申请日:2022-05-20
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院自动化研究所
IPC: G06V10/764 , G06V10/774 , G06V10/80 , G06V10/77
Abstract: 本发明提供一种小样本视频分类和分类模型训练方法及其装置,涉及计算机视觉技术领域,所述分类方法包括:将小样本分类任务输入预先构建的收敛的压缩域长短时Cross‑Transformer模型,获取压缩域信息;基于压缩域信息,获取短时融合的帧特征;基于短时融合的帧特征,获取查询特征,并输出基于查询特征获取的小样本分类任务中查询视频对各个查询类别原型所属支撑类别的分类分数,其中,分类分数最大的支撑类别用于表示查询视频的分类结果。本发明可实现少量示例视频下的快速、高精度、高效率的小样本视频分类。
-
公开(公告)号:CN115019087B
公开(公告)日:2024-11-19
申请号:CN202210557333.9
申请日:2022-05-20
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院自动化研究所
IPC: G06V10/764 , G06V10/774 , G06V10/80 , G06V10/77
Abstract: 本发明提供一种小样本视频分类和分类模型训练方法及其装置,涉及计算机视觉技术领域,所述分类方法包括:将小样本分类任务输入预先构建的收敛的压缩域长短时Cross‑Transformer模型,获取压缩域信息;基于压缩域信息,获取短时融合的帧特征;基于短时融合的帧特征,获取查询特征,并输出基于查询特征获取的小样本分类任务中查询视频对各个查询类别原型所属支撑类别的分类分数,其中,分类分数最大的支撑类别用于表示查询视频的分类结果。本发明可实现少量示例视频下的快速、高精度、高效率的小样本视频分类。
-
公开(公告)号:CN115527140A
公开(公告)日:2022-12-27
申请号:CN202210786900.8
申请日:2022-07-04
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院自动化研究所
Abstract: 本发明提供一种敏感内容检测方法、装置、电子设备和存储介质,涉及内容安全技术领域,所述方法包括:获取待检测视频;将待检测视频输入至视觉元素分析模型,得到视觉元素分析模型输出的视觉元素结果和视觉特征;将待检测视频输入至听觉元素分析模型,得到听觉元素分析模型输出的听觉元素结果和听觉特征;将视觉特征和听觉特征输入至事件检测模型,输出用于表征是否包含敏感内容的事件检测结果;将视觉元素结果和听觉元素结果与敏感内容规则库匹配,输出敏感事件类型,并结合事件检测结果和敏感事件类型,确定敏感内容检测结果。本发明可实现对视频敏感内容的全面检测,提升检测灵活度和准确度。
-
公开(公告)号:CN115563342A
公开(公告)日:2023-01-03
申请号:CN202211277485.X
申请日:2022-10-19
Applicant: 国家计算机网络与信息安全管理中心广东分中心 , 人民中科(北京)智能技术有限公司
IPC: G06F16/75 , G06F16/783 , G06F16/738
Abstract: 本发明公开了一种视频主题检索的方法、系统、设备及存储介质,用以解决现有技术样例视频的相似度计算是在较低级别上进行的问题。方法包括:S1、预训练跨模态视觉语言模型,并对所述跨模态视觉语言模型进行调整;S2、对给定的样例视频集合的场景进行分割,并对分割后的各样例视频片段的主题进行聚类;S3、基于所述调整后的跨模态视觉语言模型以及聚类的样例视频片段进行视频主题检索,并对检索结果进行聚合和排序后输出。系统包括:预训练和调整模块、分割和聚类模块、输出模块。计算机设备包括:存储器、处理器,以及计算机程序。包含计算机可执行指令的存储介质用于执行视频主题检索的方法。
-
公开(公告)号:CN116824710A
公开(公告)日:2023-09-29
申请号:CN202310587326.8
申请日:2023-05-23
Applicant: 中国科学院自动化研究所 , 人民中科(北京)智能技术有限公司
IPC: G06V40/40 , G06V40/16 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明提供一种伪造人脸鉴别方法、装置、设备和存储介质,将待鉴别图像输入人脸鉴别模型;获取人脸鉴别模型输出的待鉴别图像对应的鉴别结果;其中,人脸鉴别模型用于获取待鉴别图像的面部单元一致性特征,并基于待鉴别图像的面部单元一致性特征确定待鉴别图像对应的鉴别结果;待鉴别图像的面部单元一致性特征用于表征待鉴别图像的各面部单元相关区域之间的相关性;人脸鉴别模型是基于样本图像和样本图像对应的鉴别标签训练得到的,提升了对于未知造假方法合成的图像的鉴别效果。
-
公开(公告)号:CN111626373A
公开(公告)日:2020-09-04
申请号:CN202010484081.2
申请日:2020-06-01
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于机器学习领域,具体涉及一种多尺度加宽残差网络、小目标识别检测网络及其优化方法,本发明多尺度加宽残差网络包括串行连接的多尺度加宽卷积层、多尺度加宽残差网络单元结构;所述多尺度加宽卷积层,包括并行设置的多个不同尺度的卷积核,其输出为所述多个不同尺度的卷积核提取特征的合并;所述多尺度加宽残差网络单元结构,包括多个串联设置的所述多尺度加宽卷积层,设定两个所述多尺度加宽卷积层之间跃层连接,以直接将两层输出特征取大融合。基于本发明得到的特征进行小目标识别检测,可以提高小目标物体识别的准确度。
-
公开(公告)号:CN116824710B
公开(公告)日:2025-04-29
申请号:CN202310587326.8
申请日:2023-05-23
Applicant: 中国科学院自动化研究所 , 人民中科(北京)智能技术有限公司
IPC: G06V40/40 , G06V40/16 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明提供一种伪造人脸鉴别方法、装置、设备和存储介质,将待鉴别图像输入人脸鉴别模型;获取人脸鉴别模型输出的待鉴别图像对应的鉴别结果;其中,人脸鉴别模型用于获取待鉴别图像的面部单元一致性特征,并基于待鉴别图像的面部单元一致性特征确定待鉴别图像对应的鉴别结果;待鉴别图像的面部单元一致性特征用于表征待鉴别图像的各面部单元相关区域之间的相关性;人脸鉴别模型是基于样本图像和样本图像对应的鉴别标签训练得到的,提升了对于未知造假方法合成的图像的鉴别效果。
-
公开(公告)号:CN111626373B
公开(公告)日:2023-07-25
申请号:CN202010484081.2
申请日:2020-06-01
Applicant: 中国科学院自动化研究所
IPC: G06V10/774 , G06V10/40 , G06V10/82 , G06N3/0464
Abstract: 本发明属于机器学习领域,具体涉及一种多尺度加宽残差网络、小目标识别检测网络及其优化方法,本发明多尺度加宽残差网络包括串行连接的多尺度加宽卷积层、多尺度加宽残差网络单元结构;所述多尺度加宽卷积层,包括并行设置的多个不同尺度的卷积核,其输出为所述多个不同尺度的卷积核提取特征的合并;所述多尺度加宽残差网络单元结构,包括多个串联设置的所述多尺度加宽卷积层,设定两个所述多尺度加宽卷积层之间跃层连接,以直接将两层输出特征取大融合。基于本发明得到的特征进行小目标识别检测,可以提高小目标物体识别的准确度。
-
公开(公告)号:CN118885942B
公开(公告)日:2024-12-06
申请号:CN202411357043.5
申请日:2024-09-27
Applicant: 中国科学院自动化研究所
IPC: G06F18/2433 , G06N3/0455 , G06N3/0499 , G06N3/08 , G06F18/23213 , G06F18/2413 , G06F18/27
Abstract: 本发明提供一种基于价格模式聚类学习的歧视定价识别方法以及装置,应用于人工智能领域,上述方法包括:获取包含歧视定价场景下的订单数据;针对类别数据、时间数据以及数值数据分别进行预处理,得到订单数据集;将非歧视定价子集输入至非歧视编码器,得到非歧视编码序列;将歧视定价子集输入至歧视编码器,得到歧视编码序列;将非歧视编码序列与歧视编码序列,分别输入至非歧视定价解码器与歧视定价解码器,得到非歧视预测价格与歧视预测价格;基于订单数据的真实价格分别与非歧视预测价格与歧视预测价格进行比较,得到用于表示真实价格为非歧视定价或歧视定价的定价识别结果。通过本发明能够实时对歧视定价行为进行准确识别。
-
-
-
-
-
-
-
-
-