-
公开(公告)号:CN115063373B
公开(公告)日:2024-06-28
申请号:CN202210730860.5
申请日:2022-06-24
申请人: 山东省人工智能研究院 , 山东大学 , 青岛海尔智能技术研发有限公司 , 泰华智慧产业集团股份有限公司
IPC分类号: G06T7/00 , G06T7/13 , G06T7/181 , G06T7/73 , G06V10/80 , G06T3/4007 , G06T3/04 , G06T5/70 , G06T5/90 , G06N3/0464 , G06N3/048 , G06N3/09
摘要: 本发明公开了一种基于多尺度特征智能感知的社交网络的图像篡改定位方法,实现了基于对所有的图像篡改定位数据集的高效篡改定位;方法的具体步骤如下:对篡改图像预处理,提取边缘Groundtrhth图像,利用由sobel算子引导提取边缘特征然后采用多尺度边缘导向的注意力机制,在边缘伪影不一致的基础上挖掘篡改的粗略定位信息;构建多尺度上下文感知融合模块,利用此模块在不同的由边缘监督的尺度上进行局部和全局的搜寻,突出篡改和非篡改之间的差异;进行篡改信息的融合,输出的特征图通过样本不平衡损失来实现篡改区域的定位。本发明基于已知数据集可对其他数据集进行高效的篡改定位,能够有效地在不同篡改数据集上获得改善,并且获得极高的精度。
-
公开(公告)号:CN114842512B
公开(公告)日:2022-10-14
申请号:CN202210763141.3
申请日:2022-07-01
申请人: 山东省人工智能研究院 , 山东大学 , 苏州天瞳威视电子科技有限公司 , 泰华智慧产业集团股份有限公司
摘要: 本发明公开了基于多特征协同和语义感知的遮挡行人重识别和检索方法,属于计算机视觉和模式识别技术领域,实现了对有遮挡的行人重识别数据集的高效识别和检索;方法的具体步骤如下:图像预处理;双链网络模型搭建;双链网络的目标函数构建;基于多特征协同和人体语义感知的有遮挡行人重识别和检索方法;本发明可对现有公开有遮挡的行人重识别数据集进行高效识别和检索,能够有效地解决目标数据集由于遮挡、姿态变化造成的行人信息缺失、特征对齐困难等问题,并且方法收敛速度快。
-
公开(公告)号:CN114758285B
公开(公告)日:2022-10-14
申请号:CN202210663949.4
申请日:2022-06-14
申请人: 山东省人工智能研究院 , 山东大学 , 青岛海尔智能技术研发有限公司 , 泰华智慧产业集团股份有限公司
IPC分类号: G06V20/40 , G06K9/62 , G06V10/774
摘要: 本发明方法公开了基于锚自由和长时注意力感知的视频交互动作检测方法,属于计算机视觉和模式识别技术领域,实现了对长视频中动作部分的高效定位以及动作识别。方法的具体步骤如下:视频特征提取;搭建基于锚自由和长时注意力感知的视频交互双流网络模型;构建基于锚自由和长时注意力感知的视频交互动作检测方法的目标函数;基于锚自由和长时注意力感知的视频交互动作检测方法。本发明基于已知数据集训练后可对长视频的动作进行有效定位并进行动作识别,有效地解决了传统动作分类方法无法在长视频中进行有效分类的问题,并且提升收敛速度,提升了工作效率。
-
公开(公告)号:CN115063373A
公开(公告)日:2022-09-16
申请号:CN202210730860.5
申请日:2022-06-24
申请人: 山东省人工智能研究院 , 山东大学 , 青岛海尔智能技术研发有限公司 , 泰华智慧产业集团股份有限公司
IPC分类号: G06T7/00 , G06T7/13 , G06T7/181 , G06T3/00 , G06T5/00 , G06T7/73 , G06V10/80 , G06N3/04 , G06N3/08 , G06T3/40
摘要: 本发明公开了一种基于多尺度特征智能感知的社交网络的图像篡改定位方法,实现了基于对所有的图像篡改定位数据集的高效篡改定位;方法的具体步骤如下:对篡改图像预处理,提取边缘Groundtrhth图像,利用由sobel算子引导提取边缘特征然后采用多尺度边缘导向的注意力机制,在边缘伪影不一致的基础上挖掘篡改的粗略定位信息;构建多尺度上下文感知融合模块,利用此模块在不同的由边缘监督的尺度上进行局部和全局的搜寻,突出篡改和非篡改之间的差异;进行篡改信息的融合,输出的特征图通过样本不平衡损失来实现篡改区域的定位。本发明基于已知数据集可对其他数据集进行高效的篡改定位,能够有效地在不同篡改数据集上获得改善,并且获得极高的精度。
-
公开(公告)号:CN113111836B
公开(公告)日:2022-08-19
申请号:CN202110447506.7
申请日:2021-04-25
申请人: 山东省人工智能研究院 , 山东大学 , 河钢数字技术股份有限公司 , 河钢集团有限公司
摘要: 一种基于跨模态哈希学习的视频解析方法,实现多模态特征向汉明共空间的特征映射与融合,并利用汉明距离对具有语义相似性的视频片段‑查询语句对,进行高效检索。一方面引入双向时序卷积网络模型,深刻理解视频单元的上下文信息,以及视频内部的长期语义依赖;另一方面,引入基于多头注意力机制的文本语义理解模型,对给定查询语句进行有效表征,从而提高了视频定位的精度。本发明的特征编码模型是相互独立的,即视频片段候选集的生成与查询语句特征集的表征,可以分开独立运行。因此,当我们对给定视频完成相应的候选集生成之后,可以根据不同用户的多样性需求,对当前视频反复进行基于汉明距离度量的高效视频定位。
-
公开(公告)号:CN114842512A
公开(公告)日:2022-08-02
申请号:CN202210763141.3
申请日:2022-07-01
申请人: 山东省人工智能研究院 , 山东大学 , 苏州天瞳威视电子科技有限公司 , 泰华智慧产业集团股份有限公司
摘要: 本发明公开了基于多特征协同和语义感知的遮挡行人重识别和检索方法,属于计算机视觉和模式识别技术领域,实现了对有遮挡的行人重识别数据集的高效识别和检索;方法的具体步骤如下:图像预处理;双链网络模型搭建;双链网络的目标函数构建;基于多特征协同和人体语义感知的有遮挡行人重识别和检索方法;本发明可对现有公开有遮挡的行人重识别数据集进行高效识别和检索,能够有效地解决目标数据集由于遮挡、姿态变化造成的行人信息缺失、特征对齐困难等问题,并且方法收敛速度快。
-
公开(公告)号:CN113111836A
公开(公告)日:2021-07-13
申请号:CN202110447506.7
申请日:2021-04-25
申请人: 山东省人工智能研究院 , 山东大学 , 河钢数字技术股份有限公司 , 河钢集团有限公司
摘要: 一种基于跨模态哈希学习的视频解析方法,实现多模态特征向汉明共空间的特征映射与融合,并利用汉明距离对具有语义相似性的视频片段‑查询语句对,进行高效检索。一方面引入双向时序卷积网络模型,深刻理解视频单元的上下文信息,以及视频内部的长期语义依赖;另一方面,引入基于多头注意力机制的文本语义理解模型,对给定查询语句进行有效表征,从而提高了视频定位的精度。本发的特征编码模型是相互独立的,即视频片段候选集的生成与查询语句特征集的表征,可以分开独立运行。因此,当我们对给定视频完成相应的候选集生成之后,可以根据不同用户的多样性需求,对当前视频反复进行基于汉明距离度量的高效视频定位。
-
公开(公告)号:CN115100014B
公开(公告)日:2023-03-24
申请号:CN202210730497.7
申请日:2022-06-24
申请人: 山东省人工智能研究院 , 山东大学 , 烟台艾睿光电科技有限公司 , 泰华智慧产业集团股份有限公司
摘要: 本发明公开基于多层次化感知的社交网络图像复制移动伪造检测方法,该发明具体包含以下步骤:(1)自相关匹配分支对整张图像生成自相关得分图,(2)参考自相关得分图生成可疑图像块,(3)成对可疑图像块的关键点匹配,(4)融合两种得分图和损失函数约束网络训练。本发明先利用自相关匹配寻找整张伪造图像的可疑区域,然后使用关键点匹配淡化误警告区域和激活遗漏区域,使得匹配结果更加精准。本发明提出的关键点匹配分支,能解决现有的算法无法在平滑的伪造区域生成高质量的关键点匹配的问题。本方法生成最终预测掩码时,不仅考虑了自相关匹配的结果,也考虑了点匹配的结果,这种基于多层次感知的检测方法能生成更加精确的预测结果图。
-
公开(公告)号:CN114998934A
公开(公告)日:2022-09-02
申请号:CN202210742934.7
申请日:2022-06-27
申请人: 山东省人工智能研究院 , 山东大学 , 苏州天瞳威视电子科技有限公司 , 青岛海尔智能技术研发有限公司
IPC分类号: G06V40/10 , G06V10/82 , G06V10/80 , G06V10/774 , G06V10/764 , G06V10/40 , G06V10/26 , G06N3/04 , G06F16/583
摘要: 本发明提供一种基于多模态智能感知和融合的换衣行人重识别和检索方法、系统、电子设备及存储介质,属于计算机视觉技术领域,通过对原始的行人图像进行像素采样,并根据人体解析图对所获取的像素进行修改获得换衣后的行人图像;然后分别对原始的行人图像和换衣后的行人图像进行2D特征提取,对点云数据进行3D特征提取;最后根据提取的特征进行行人身份识别。最终达到了高效、精准地行人换衣重识别的技术效果。
-
公开(公告)号:CN113065012B
公开(公告)日:2022-04-22
申请号:CN202110288644.5
申请日:2021-03-17
申请人: 山东省人工智能研究院 , 山东大学
摘要: 一种基于多模态动态交互机制的图文解析方法,提出了一个动态模态交互建模框架用于解决图文检索问题,该框架不仅能够涵盖现有方法的交互模式,还能够自动学习其他未被探索到的模式。为了赋予模型充分的模态交互能力,从不同角度、不同粒度设计了四种基础的交互模块,其有效解决了模态内推理和模态间对齐两大图文检索中的核心挑战。为了动态地学习模态交互模式,在每个交互模块中整合了一个动态路由器。通过提出的语义一致性正则化技术对路径决策过程进行了合理的、强有力的约束,确保了模型路径学习的高效性。在进行图像和文本之间的相互检索时准确度大幅度提高。
-
-
-
-
-
-
-
-
-