-
公开(公告)号:CN114758285A
公开(公告)日:2022-07-15
申请号:CN202210663949.4
申请日:2022-06-14
申请人: 山东省人工智能研究院 , 山东大学 , 青岛海尔智能技术研发有限公司 , 泰华智慧产业集团股份有限公司
IPC分类号: G06V20/40 , G06K9/62 , G06V10/774
摘要: 本发明方法公开了基于锚自由和长时注意力感知的视频交互动作检测方法,属于计算机视觉和模式识别技术领域,实现了对长视频中动作部分的高效定位以及动作识别。方法的具体步骤如下:视频特征提取;搭建基于锚自由和长时注意力感知的视频交互双流网络模型;构建基于锚自由和长时注意力感知的视频交互动作检测方法的目标函数;基于锚自由和长时注意力感知的视频交互动作检测方法。本发明基于已知数据集训练后可对长视频的动作进行有效定位并进行动作识别,有效地解决了传统动作分类方法无法在长视频中进行有效分类的问题,并且提升收敛速度,提升了工作效率。
-
公开(公告)号:CN113065012A
公开(公告)日:2021-07-02
申请号:CN202110288644.5
申请日:2021-03-17
申请人: 山东省人工智能研究院 , 山东大学
摘要: 一种基于多模态动态交互机制的图文解析方法,提出了一个动态模态交互建模框架用于解决图文检索问题,该框架不仅能够涵盖现有方法的交互模式,还能够自动学习其他未被探索到的模式。为了赋予模型充分的模态交互能力,从不同角度、不同粒度设计了四种基础的交互模块,其有效解决了模态内推理和模态间对齐两大图文检索中的核心挑战。为了动态地学习模态交互模式,在每个交互模块中整合了一个动态路由器。通过提出的语义一致性正则化技术对路径决策过程进行了合理的、强有力的约束,确保了模型路径学习的高效性。在进行图像和文本之间的相互检索时准确度大幅度提高。
-
公开(公告)号:CN114998934B
公开(公告)日:2023-01-03
申请号:CN202210742934.7
申请日:2022-06-27
申请人: 山东省人工智能研究院 , 山东大学 , 苏州天瞳威视电子科技有限公司 , 青岛海尔智能技术研发有限公司
IPC分类号: G06V40/10 , G06V10/82 , G06V10/80 , G06V10/774 , G06V10/764 , G06V10/40 , G06V10/26 , G06N3/04 , G06F16/583
摘要: 本发明提供一种基于多模态智能感知和融合的换衣行人重识别和检索方法、系统、电子设备及存储介质,属于计算机视觉技术领域,通过对原始的行人图像进行像素采样,并根据人体解析图对所获取的像素进行修改获得换衣后的行人图像;然后分别对原始的行人图像和换衣后的行人图像进行2D特征提取,对点云数据进行3D特征提取;最后根据提取的特征进行行人身份识别。最终达到了高效、精准地行人换衣重识别的技术效果。
-
公开(公告)号:CN114758362B
公开(公告)日:2022-10-11
申请号:CN202210670639.5
申请日:2022-06-15
申请人: 山东省人工智能研究院 , 山东大学 , 烟台艾睿光电科技有限公司 , 苏州天瞳威视电子科技有限公司
IPC分类号: G06V40/10 , G06V20/52 , G06V20/70 , G06V10/26 , G06V10/28 , G06V10/74 , G06V10/82 , G06N3/04 , G06K9/62
摘要: 本发明提供一种基于语义感知注意力和视觉屏蔽的换衣行人重识别方法、系统、电子设备及存储介质,属于计算机视觉技术领域,根据人体语义分割信息分别定位人体和服装区域。通过人体语义注意力网络获得前景增强的特征表示,以突出前景信息并为原始特征图重新赋权重。通过衣物视觉外观屏蔽网络获得原始特征和视觉屏蔽特征表示。本发明通过人体语义注意力网络,可以尽可能地减少背景信息的负面影响,并获得更多的辨别性特征。通过衣物视觉外观屏蔽网络,将换衣行人重识别模型集中在与衣服无关的视觉语义信息上为行人提取更稳健的特征表示。本发明具备科学性、系统性和鲁棒性的技术效果。
-
公开(公告)号:CN115100014A
公开(公告)日:2022-09-23
申请号:CN202210730497.7
申请日:2022-06-24
申请人: 山东省人工智能研究院 , 山东大学 , 烟台艾睿光电科技有限公司 , 泰华智慧产业集团股份有限公司
摘要: 本发明公开基于多层次化感知的社交网络图像复制移动伪造检测方法,该发明具体包含以下步骤:(1)自相关匹配分支对整张图像生成自相关得分图,(2)参考自相关得分图生成可疑图像块,(3)成对可疑图像块的关键点匹配,(4)融合两种得分图和损失函数约束网络训练。本发明先利用自相关匹配寻找整张伪造图像的可疑区域,然后使用关键点匹配淡化误警告区域和激活遗漏区域,使得匹配结果更加精准。本发明提出的关键点匹配分支,能解决现有的算法无法在平滑的伪造区域生成高质量的关键点匹配的问题。本方法生成最终预测掩码时,不仅考虑了自相关匹配的结果,也考虑了点匹配的结果,这种基于多层次感知的检测方法能生成更加精确的预测结果图。
-
公开(公告)号:CN114758362A
公开(公告)日:2022-07-15
申请号:CN202210670639.5
申请日:2022-06-15
申请人: 山东省人工智能研究院 , 山东大学 , 烟台艾睿光电科技有限公司 , 苏州天瞳威视电子科技有限公司
IPC分类号: G06V40/10 , G06V20/52 , G06V20/70 , G06V10/26 , G06V10/28 , G06V10/74 , G06V10/82 , G06N3/04 , G06K9/62
摘要: 本发明提供一种基于语义感知注意力和视觉屏蔽的换衣行人重识别方法、系统、电子设备及存储介质,属于计算机视觉技术领域,根据人体语义分割信息分别定位人体和服装区域。通过人体语义注意力网络获得前景增强的特征表示,以突出前景信息并为原始特征图重新赋权重。通过衣物视觉外观屏蔽网络获得原始特征和视觉屏蔽特征表示。本发明通过人体语义注意力网络,可以尽可能地减少背景信息的负面影响,并获得更多的辨别性特征。通过衣物视觉外观屏蔽网络,将换衣行人重识别模型集中在与衣服无关的视觉语义信息上为行人提取更稳健的特征表示。本发明具备科学性、系统性和鲁棒性的技术效果。
-
公开(公告)号:CN113111837B
公开(公告)日:2022-05-13
申请号:CN202110447507.1
申请日:2021-04-25
申请人: 山东省人工智能研究院 , 山东大学 , 河钢数字技术股份有限公司 , 河钢集团有限公司
摘要: 一种基于多媒体语义解析的监控视频智能预警方法,通过建立跨模态语义对齐模型对视频中所包含的复杂对象与交互进行准确理解,并生成视频片段时空位置图和视频语义树,另一方面,引入基于双向长短时记忆网络的文本编码模块,对查询语句中的文本语义进行深刻理解与表征。实现多模态特征向共空间的特征映射与融合,并利用语义剪枝策略,粗粒度筛选出精炼的“视频片段‑查询语句”对,进行细粒度语义匹配计算,从而确保跨模态视频定位的精度与效率。
-
公开(公告)号:CN113111959A
公开(公告)日:2021-07-13
申请号:CN202110446459.4
申请日:2021-04-25
申请人: 山东省人工智能研究院 , 山东大学 , 河钢数字技术股份有限公司 , 河钢集团有限公司
摘要: 一种基于时序表征学习的安全隐患分类方法,通过基于时序表征的分类模型对时序变化趋势、时序上下文信息进行综合理解,能够对时序特征进行增强表征,从而提高分类精度,能够基于注意力机制,对时间序列的重要时序特征进行有效的标识,实现分类可解释性。并利用注意力机制对分类结果进行具有可解释性的数据可视化。
-
公开(公告)号:CN113111837A
公开(公告)日:2021-07-13
申请号:CN202110447507.1
申请日:2021-04-25
申请人: 山东省人工智能研究院 , 山东大学 , 河钢数字技术股份有限公司 , 河钢集团有限公司
摘要: 一种基于多媒体语义解析的监控视频智能预警方法,通过建立跨模态语义对齐模型对视频中所包含的复杂对象与交互进行准确理解,并生成视频片段时空位置图和视频语义树,另一方面,引入基于双向长短时记忆网络的文本编码模块,对查询语句中的文本语义进行深刻理解与表征。实现多模态特征向共空间的特征映射与融合,并利用语义剪枝策略,粗粒度筛选出精炼的“视频片段‑查询语句”对,进行细粒度语义匹配计算,从而确保跨模态视频定位的精度与效率。
-
公开(公告)号:CN118279306B
公开(公告)日:2024-08-09
申请号:CN202410703254.3
申请日:2024-06-03
申请人: 齐鲁工业大学(山东省科学院) , 山东省人工智能研究院 , 天津理工大学 , 山东中联视听信息科技股份有限公司 , 北京阿叟阿巴科技有限公司
摘要: 本发明涉及数字图像处理技术领域,尤其涉及一种边缘引导的双链多尺度图像伪造区域检测方法及系统,具体如下:构建规范化输入图像,将待检图像送入骨干网络提取多尺度特征,多尺度特征包括RGB链和边缘链两条线索链,边缘图像由RGB图像经直方图均衡化、二阶微分锐化和边界提取得到;构建RGB链提取RGB图像篡改伪影特征;构建边缘链提取边缘图像篡改伪影特征;RGB链与边缘链邻接融合编码;多尺度推理预测;损失函数监督训练。本发明在损失函数和推理判别器双重约束下优化模型参数和性能,提高了模型的泛化能力,增强了实际应用中的稳定性和可靠性。本发明能够对篡改伪造图像进行识别,为数字图像取证、数字图像伪造鉴别提供了有效的技术方法。
-
-
-
-
-
-
-
-
-